离开OpenAI待业的Karpathy推出大模型新项目minbpe
站长网2024-02-18 14:46:350阅
要点:
1、Karpathy宣布离开OpenAI后不懈努力,推出新项目minbpe,一天内GitHub标星量达到1.2k。
2、minbpe项目旨在为LLM中常用的BPE算法创建干净、教育性的代码。
3、minbpe项目提供了两个Tokenizer,实现训练、编码和解码等主要功能。
最近,Karpathy离开OpenAI后并未放松,快速推出了新项目minbpe。该项目的GitHub标星数量在短短一天内就突破了1.2k,展现出了巨大的关注度和吸引力。这一动态引发了网友们的热烈讨论和期待。
项目地址:https://github.com/karpathy/minbpe
minbpe项目的初衷在于为LLM中广泛使用的BPE算法打造最简洁、最清晰、最具教育性的代码。通过提供两种Tokenizer,minbpe项目实现了对分词器的训练、编码和解码等核心功能。这样的设计不仅提高了代码的可读性,还为用户提供了更便捷、高效的操作体验。
具体来看,minbpe项目存储库中包含了基于类的Tokenizer实现,如BaseTokenizer和BasicTokenizer等。这些类的设计旨在提供训练、编码和解码的基本功能,以及保存和加载等实用功能。此外,RegexTokenizer和GPT4Tokenizer等的实现进一步拓展了项目的功能,为用户提供了更多选择和可能性。
除了代码的实现,Karpathy还表示会很快发布相关的教学视频,进一步帮助用户理解和应用minbpe项目。这种全方位的服务和支持将使项目更具实用性和吸引力,为广大用户带来更多的价值和帮助。相信随着项目的不断发展和完善,minbpe将在人工智能领域发挥重要作用,为行业的进步和发展贡献力量。
0000
评论列表
共(0)条相关推荐
ChatGPT新增聊天存档功能,可构建自己的聊天数据库啦!
12月21日,OpenAI在社交平台宣布,ChatGPT新增存档功能,用户可以保存聊天记录而不必删除它们。虽然这只是一个很小的功能,但对于科研、医疗、写作、金融、律师等,对文本使用频率较高的行业帮助巨大,可构建自己的文本资料数据库,并进行精细化管理。0000马云成立马家厨房公司 经营范围含销售预制菜
最新工商信息显示,11月22日,由马云持股99.9%的杭州大井头贰拾贰号文化艺术有限公司新增一家子公司,主营预制菜、农产品加工和批发等。该子公司名为杭州马家厨房食品有限公司,法定代表人为PAUJASONJOHN,注册资本1000万人民币,经营范围包括食品销售(仅销售预包装食品)、货物进出口、食用农产品批发、日用品批发、酒店管理、技术服务等。站长网2023-11-24 08:27:550000微软Windows11更新 可从PC和安卓屏幕截图复制文字
近日,微软正在对Windows11进行一系列功能升级,针对截图工具和照片应用进行优化,为用户提供更多实用功能。更新后的Windows11截图工具加入了文字识别和复制功能,用户可以对屏幕截图进行文字检测,并可选择性复制需要的文字内容,大大优化了图片中的文字资料的转录和利用。同时针对手机链接应用进行升级,当在安卓手机拍照后,可快速通过截图工具提取照片中的文字。站长网2023-09-15 09:43:28000219.9万不可能买到!雷军回应小米汽车售价贵:相当于传统燃油车两三百万豪车的性能
快科技1月21日消息,近日,雷军接受央视采访时,再度回应小米汽车售价。雷军表示,小米汽车相当于传统燃油车两三百万豪车的性能,配置非常强,成本也是非常之高的。大家喊的9.9万元、14.9万元甚至19.9万元都是是在开玩笑。定价确实会有点贵,我们会在小米汽车正式产品发布会上公布。”雷军表示,现在小米汽车已小规模量产,预计2024年上半年上市。0000Meta发布AI图片学习模型I-JEPA:可自我学习推理
Meta的首席人工智能科学家YannLeCun已经讨论了几年能够在很少或完全不需要人类的帮助下学习世界模型的深度学习系统。现在,这个愿景正在慢慢实现,因为Meta刚刚发布了I-JEPA的第一个版本,这是一个机器学习(ML)模型,通过对图像的自我监督学习来学习世界的抽象表示。站长网2023-06-16 16:45:190003