首页站长资讯MosaicML和Together推出可商用开源大模型性能不输LLaMA

MosaicML和Together推出可商用开源大模型性能不输LLaMA

站长网2023-05-08 10:07:084阅

虽然Meta的LLaMA已经成为开源AI重要力量，但由于其只可用于研究用途，而且申请麻烦而被业界诟病。现在，MosaicML和Together推出可商用开源大模型，性能不输LLaMA。

MosaicML的MPT系列模型支持84k tokens超长输入，并用FlashAttention和FasterTransformer方法针对训练和推理速度做过优化。其中70亿参数版在性能测试中与LLaMA打个平手。

除了MPT-7B Base基础模型外还有三个变体。MPT-7B-Instruct，用于遵循简短指令。MPT-7B-Chat，用于多轮聊天对话。MPT-7B-StoryWriter-65k ，用于阅读和编写故事，支持65k tokens的超长上下文，用小说数据集微调。

Together的RedPajama系列模型在5TB的同名开源数据上训练而来，除了70亿参数基础模型外，还有一个30亿参数版本，可以在5年前发售的RTX2070游戏显卡上运行。

据了解，MosaicML由前英特尔AI芯片项目Nervana负责人Naveen Rao创办，致力于降低训练神经网络的成本。RedPajama由苹果前高管Vipul Ved Prakash，斯坦福大模型研究中心主任Percy Liang，苏黎世联邦理工大学助理教授张策等人联合创办。

这些开源大模型的推出，标志着开源大模型生态有了寒武纪大爆发的早期迹象。这将有助于降低人工智能技术的门槛，促进人工智能的发展。也将有助于加强人工智能技术的透明度和可解释性，避免人工智能技术被滥用。

MosaicML和Together推出可商用开源大模型性能不输LLaMA

0004

评论列表

共(0)条

相关推荐

站长资讯
马克龙会见 Meta、谷歌人工智能专家法国生成式 AI 蓝图本周公布
马克龙总统日前与Meta和Alphabet旗下的Google等人工智能专家会面，讨论法国在AI研究和监管中的角色。
站长网2023-06-12 16:57:39
0000
站长资讯
微软因安全问题暂时禁止员工使用ChatGPT
**划重点:**1.🌐微软暂时禁止员工使用ChatGPT，引起关注。2.💰尽管是OpenAI最大的投资者，微软提到ChatGPT是第三方服务，存在安全隐患。3.⚡️禁用行为被迅速撤销，微软称之为失误，强调推荐使用更安全的BingChatEnterprise和ChatGPTEnterprise。
站长网2023-11-10 18:01:20
0000
站长资讯
英伟达RTX Remix modders推出对应Comfyui节点可对游戏资产放大和重绘
英伟达的RTXRemixmodders最近推出了与Comfyui兼容的新节点，这标志着游戏模组制作和资源增强方面的一大进步。通过这个新节点，模组制作者现在可以直接在Comfyui界面中对已有的游戏资产进行放大和重新绘制，这大大简化了游戏资源的编辑和升级过程。
站长网2024-06-05 15:41:18
0001
站长资讯
微信淘宝小红书等App试点网络身份证：认证后不再输入姓名、身份证号
快科技8月2日消息，申领和使用网号”、网证”的应用国家网络身份认证App”已在应用商店上线。据悉，申领了网证之后，用户会得到一张虚拟的网络身份证”，它可以向需要实名认证的互联网平台进行认证，不再需要输入姓名和身份证号等信息。值得注意的是，申领注册网号”网证”需要使用身份证以及人脸识别，并关联手机号，设置网络身份口令，授权网络身份在用户手机使用。
站长网2024-08-02 08:58:13
0002
站长资讯
最强大开源语言模型？FalconLM号称性能击败Meta的LLaMA
当下，开源语言模型如雨后春笋般的冒出，其中有部分号称性能比Meta、谷歌等大科技公司开发的产品更优秀。最近，一款名为FalconLM开源语言模型就号称提供了比Meta的LLaMA更好的性能，也可以用于商业。但如果收入超过100万美元，则商业用途需要缴纳特许权使用费。
站长网2023-05-30 10:48:09
0000