Adept AI开源8亿参数语言模型Persimmon-8B
站长网2023-09-13 09:55:130阅
要点:
1、开源了Persimmon-8B,这是目前参数量少于10亿的最强大的完全免许可语言模型
2、该模型具有16K的上下文长度,超过了LLaMA2的4倍和GPT-3的8倍
3、提供了灵活快速的推理代码,在一块A100GPU上可以每秒生成56个token
Anthropic公司最近开源了Persimmon-8B,这是目前参数量少于10亿的完全免许可使用的最强大语言模型。该模型采用Apache许可证发布,代码和权重已在GitHub上开源。
Anthropic的目标是开发一个可以协助用户完成各种计算机操作的AI助手。他们并不专注于开发独立的语言模型,但Persimmon-8B是他们模型扩展计划的早期产出,可以给社区提供一个更强大的8亿参数语言模型以进行各种创新应用的开发。8亿参数量的模型可以在单个GPU上进行微调,在现代笔记本电脑上以合适的速度运行,甚至可以容纳在移动设备上。
Persimmon-8B具有几个突出特点:
1、这是目前开源的、完全免许可使用的参数量少于10亿的最强大语言模型
2、使用16K的上下文长度进行从头训练,远超过LLaMA2的4K和GPT-3等模型的2K
3、基础模型的性能甚至超过了LLaMA2,尽管训练数据量只有后者的37%
4、模型保留了70K个词向量以进行多模态扩展,并采用了稀疏激活
5、提供了灵活快速的推理代码实现,可以在一块A100GPU上达到每秒生成56个token的速度
通过直接长序列训练,Persimmon-8B能够捕捉更长的上下文关系,这为各种应用带来了独特优势。Anthropic希望社区可以在该模型的基础上进行更多创新,同时也乐于听到用户的反馈。这只是一个早期小规模的开源,他们未来还计划开源更多内容。
0000
评论列表
共(0)条相关推荐
张朝阳谈ChatGPT:不具备情绪和创造性 人类的智慧可以控制AI
最近,搜狐的创始人和董事长兼首席执行官张朝阳以及深石集团的创始人王石进行了一次对话。在谈及近期炙手可热的ChatGPT时,张朝阳指出,“GPT算法和人类的思维方式不同,它没有人类的情感和创意,而人类可以制定更好的法律,向AI输入理念,使之成为人类的好朋友。“我们的智慧和意识可以控制AI。”站长网2023-04-17 16:02:560001OPPO Find X7明日开售 价格3999元起
OPPOFindX7将于明天正式发售,作为OPPO最强悍的天玑手机,其起售价为3999元。这款手机搭载了联发科天玑9300移动平台,并配备了满血版的LPDDR5X内存和UFS4.0闪存。0000腾讯2024年Q1财报出炉:营收 1595 亿元 同比增长6%
腾讯控股今日公布了截至2024年3月31日的第一季度财报,营收持续增长,达到1595亿元,同比增长6%。这一成绩再次证明了腾讯在全球互联网行业的领先地位。在利润方面,腾讯也取得了显著增长。权益持有人应占利润为419亿元,同比增长高达62%。若按照非国际财务报告准则计算,权益持有人应占利润更是达到了503亿元,同比增长54%。站长网2024-05-14 17:06:450002三星推出人工智能驱动的食谱应用程序「Food」:包含 160000 种菜谱
三星电子周三宣布,将推出一款由人工智能驱动的食品和食谱应用程序,其中包含160,000个菜谱供用户使用。该应用程序名为「Food」,是基于其2019年收购的Whisk食品数据库开发而来。图片来自Samsung站长网2023-08-31 10:17:540000春运期间滴滴打车需求飙升65% 40城设福利站感谢司机师傅
滴滴出行数据显示,今年春运开启以来,相比2019年同期,打车需求上涨了65%,整个春运期间打车需求预计将相比2019年同期上涨约40%。滴滴计划在全国40个城市举办第十届滴滴司机福利站,为服务岗位的司机师傅送去节日礼物与关怀,并发放超过3亿元的司机补贴。站长网2024-01-31 11:11:270000