MosaicML和Together推出可商用开源大模型 性能不输LLaMA
站长网2023-05-08 10:07:084阅
虽然Meta的LLaMA已经成为开源AI重要力量,但由于其只可用于研究用途,而且申请麻烦而被业界诟病。现在,MosaicML和Together推出可商用开源大模型,性能不输LLaMA。
MosaicML的MPT系列模型支持84k tokens超长输入,并用FlashAttention和FasterTransformer方法针对训练和推理速度做过优化。其中70亿参数版在性能测试中与LLaMA打个平手。
除了MPT-7B Base基础模型外还有三个变体。MPT-7B-Instruct,用于遵循简短指令。MPT-7B-Chat,用于多轮聊天对话。MPT-7B-StoryWriter-65k ,用于阅读和编写故事,支持65k tokens的超长上下文,用小说数据集微调。
Together的RedPajama系列模型在5TB的同名开源数据上训练而来,除了70亿参数基础模型外,还有一个30亿参数版本,可以在5年前发售的RTX2070游戏显卡上运行。
据了解,MosaicML由前英特尔AI芯片项目Nervana负责人Naveen Rao创办,致力于降低训练神经网络的成本。RedPajama由苹果前高管Vipul Ved Prakash,斯坦福大模型研究中心主任Percy Liang,苏黎世联邦理工大学助理教授张策等人联合创办。
这些开源大模型的推出,标志着开源大模型生态有了寒武纪大爆发的早期迹象。这将有助于降低人工智能技术的门槛,促进人工智能的发展。也将有助于加强人工智能技术的透明度和可解释性,避免人工智能技术被滥用。
0004
评论列表
共(0)条相关推荐
嘀嗒出行再向港交所提交上市申请 2023年收入约8.151亿元
近日,顺风车行业巨头嘀嗒出行(DidaInc.)再次向港交所递交了主板上市申请,这次是在3月19日完成的。此前,该公司已经于2020年10月8日、2021年4月13日、2023年2月20日和2023年8月30日先后四次递交上市申请,但均未能成功。而此次申请,嘀嗒出行得到了中金公司、海通国际及野村国际的联合保荐支持。站长网2024-03-20 10:01:000002AssemblyAI斩获5000万美元融资 致力构建通用语音模型
随着全球对以人工智能为中心系统的投资达到预计的1540亿美元,初创公司AssemblyAI正迅速崛起,为企业提供创新的“应用人工智能”解决方案。安永的最新调查显示,尽管生成式人工智能的部署前景变得更加复杂,但市场仍然充满活力。站长网2023-12-05 10:12:220000苹果WWDC放出深水炸弹 GPT-4o加持Siri 全家桶都上生成式AI
在2024年的全球开发者大会WWDC上,苹果公司宣布了一系列重大更新,标志着其全线产品正式进入生成式AI时代。这次更新的核心是AppleIntelligence,一个全新的个性化智能系统,全面整合了生成式AI的能力,覆盖了iPhone、iPad和Mac。AppleIntelligence的关键特点包括:站长网2024-06-11 18:06:4800004000亿流量扶持、预计全年变现超千亿,详解快手还有哪些新机遇
“一笑平时最喜欢刷快手,你看,有了我,他连自我介绍都不需要亲自来了,这样他刷快手的时间又多了。”8月10日,2023快手光合创作者大会上,一位自称“程一笑分笑”的数字人和现场观众打起招呼。作为快手一年一度的秀肌肉时刻,数字人老板们的出现为今年的大会现场带来了新鲜的气息。站长网2023-08-11 15:55:350001王小川回击百度副总裁 暗讽其脱离一线更久
近日,百度副总裁、搜索平台负责人肖阳发表言论,称王小川“脱离一线太久,确实和我们不在一个宇宙”。王小川回应道:“什么样的平行宇宙里,才能做到让一个脱离一线15年的人,去怼一个脱离一线1.5年的人。”此前,36氪专访王小川时,谈及李彦宏称“百度的文心一言和OpenAI差距可能在两个月左右”,王小川回应表示“你们(36氪)采访的可能是平行世界的他(李彦宏),不是我们这个世界里的。”站长网2023-04-14 14:11:370000