MosaicML和Together推出可商用开源大模型 性能不输LLaMA
站长网2023-05-08 10:07:084阅
虽然Meta的LLaMA已经成为开源AI重要力量,但由于其只可用于研究用途,而且申请麻烦而被业界诟病。现在,MosaicML和Together推出可商用开源大模型,性能不输LLaMA。
MosaicML的MPT系列模型支持84k tokens超长输入,并用FlashAttention和FasterTransformer方法针对训练和推理速度做过优化。其中70亿参数版在性能测试中与LLaMA打个平手。
除了MPT-7B Base基础模型外还有三个变体。MPT-7B-Instruct,用于遵循简短指令。MPT-7B-Chat,用于多轮聊天对话。MPT-7B-StoryWriter-65k ,用于阅读和编写故事,支持65k tokens的超长上下文,用小说数据集微调。
Together的RedPajama系列模型在5TB的同名开源数据上训练而来,除了70亿参数基础模型外,还有一个30亿参数版本,可以在5年前发售的RTX2070游戏显卡上运行。
据了解,MosaicML由前英特尔AI芯片项目Nervana负责人Naveen Rao创办,致力于降低训练神经网络的成本。RedPajama由苹果前高管Vipul Ved Prakash,斯坦福大模型研究中心主任Percy Liang,苏黎世联邦理工大学助理教授张策等人联合创办。
这些开源大模型的推出,标志着开源大模型生态有了寒武纪大爆发的早期迹象。这将有助于降低人工智能技术的门槛,促进人工智能的发展。也将有助于加强人工智能技术的透明度和可解释性,避免人工智能技术被滥用。
0004
评论列表
共(0)条相关推荐
美国、英国和其他十几个国家签署协议,确保人工智能 「设计安全」
美国、英国及其他十几个个国家于周日联合发布了一份20页的文件,标志着首个详细的国际协议在如何保护人工智能(AI)免受恶意行为者滥用方面达成一致。美国一高级官员描述此协议为确保公司创建的AI系统从设计开始就是安全的重要步骤。站长网2023-11-27 09:20:290000怎么制作ai卡通头像?推荐10个好用的AI生成卡通头像工具
人工智能漫画工具的出现标志着技术与创造力的迷人交汇。这些工具利用人工智能算法的力量,改变了我们将图像和视频转换为卡通风格表示的方式。从专业设计师到休闲用户,人工智能漫画家提供了简单与复杂的独特融合,只需点击几下即可创建令人惊叹的风格化视觉效果。站长网2023-12-28 18:09:020002月之暗面开放Kimi Chat 200 万字上下文的内测申请
月之暗面近日宣布,其智能助手KimiChat已开放200万字上下文的内测申请,引发了广大用户的热烈关注。作为MoonshotAI公司的产品,KimiChat以其超大的内存和强大的功能吸引了众多用户的目光。申请试用入口:https://top.aibase.com/tool/kimi-chat站长网2024-03-18 15:44:040002iPhone16或涨价 分析师:顶配版售价可能突破2万元
随着苹果公司宣布即将在北京时间9月10日凌晨1时举行特别活动,外界普遍预期将发布新款iPhone16系列。不过,与新品发布相伴而来的还有可能的价格全面上涨。据媒体报道,新款iPhone16系列的售价可能会因为引入苹果AI技术、全球芯片价格上涨以及成本增加等因素而全面提高。站长网2024-08-27 23:03:110000新能源品牌周销量来了:比亚迪再次稳居榜首 小鹏杀进第七
快科技10月25日消息,日前,根据各品牌公布的信息我们了解到,在刚刚过去的一周里,新能源汽车的市场发生了很大的变化。从各品牌公布的数据来看,比亚迪依旧稳居榜首,一周卖出了5.19万辆新能源汽车。五菱汽车紧随其后,从上周的第四名成功杀进前三,以0.94万辆的成绩拿下第二,埃安稳扎稳打,以0.93万辆的成绩荣获第三。站长网2023-10-25 20:14:340000