首页站长资讯Meta的LLaMA模型开源替代品来了，OpenLLaMAH可用于商业用途

Meta的LLaMA模型开源替代品来了，OpenLLaMAH可用于商业用途

站长网2023-05-06 14:57:192阅

LLaMA 等大型语言模型的成功推动了开源聊天机器人的发展，但对这些模型的许可限制限制了它们的商业用途。OpenLLaMA 为希望使用语言模型的企业提供了一种更易于访问且更具成本效益的选择.

OpenLLaMA 是 Meta 的 LLaMA 语言模型的开源复制品，可以用于商业目的。自 Meta 的 LLaMA 系列大型语言模型的揭开面纱以及随后的泄露以来，开源聊天机器人的发展已经猛增。诸如 Alpaca、Vicuna 和 OpenAssistant 的模型都以Meta的模型为基础，采用不同形式的指令调整。

然而，LLaMA 模型仅供研究使用许可，这限制了该模型的商业应用。

OpenLLaMA 复制了 Meta 的语言模型。基于其他免费提供的模型的替代方案与 Meta 模型的质量不匹配，因为 LLaMA 遵循 Deepmind 的Chinchilla缩放法则并且已经过特别大量数据的训练。

Berkeley AI Research 的研究人员希望在 OpenLLaMA 项目中复制 Meta 的 LLaMA 模型。该团队正在为该项目使用 Together 的 RedPajama 数据集。开源平台还宣布打算在4月复制 LLaMA 模型，作为第一步发布1.2万亿参数数据集。

Together网址:https://www.together.xyz/blog/redpajama-training-progress

伯克利团队现在发布了70亿参数 OpenLLaMA 模型的早期版本，该模型迄今已在1.2万亿token中的3000亿个上进行了训练。据说性能已经接近 LLaMA 的水平，并且团队相信经过全面训练的 OpenLLaMA 将与 Meta 的原始版本竞争。

除了70亿参数模型，OpenLLaMA 团队还在训练一个30亿参数版本，以便在资源有限的用例中使用强大的语言模型。该团队目前没有更大模型的计划。

OpenLLaMA项目网址:https://github.com/openlm-research/open_llama

Meta的LLaMA模型开源替代品来了OpenLLaMAH可用于商业用途

0002

评论列表

共(0)条

相关推荐

报告显示：我国网民规模达10.79亿互联网普及率76.4%
站长之家(ChinaZ.com)8月28日消息:8月28日，中国互联网络信息中心发布第52次《中国互联网络发展状况统计报告》。报告显示，截至2023年6月，我国网民规模达10.79亿人，较2022年12月增长1109万人，互联网普及率达76.4%。
站长网站长资讯2023-08-28 14:42:12
0000
站长资讯
Nightshade:艺术家全新反击工具，可用损坏训练数据“毒害”AI模型
划重点:1.🤖艺术家反击AI:艺术家可以使用一种名为Nightshade的新工具，向他们的图像注入隐形的像素，使AI模型产生错误的认知。2.📜背景:AI公司依赖大量的训练数据，包括来自艺术家的创作，引发了一系列法律诉讼。3.💡希望与风险:Nightshade的开发者希望通过这一工具重塑AI与艺术家之间的权力平衡，但也承认可能被滥用。
站长网2023-10-24 23:51:57
0000
站长资讯
Canalys：2023第二季度亚马逊云AWS继续领跑云服务市场
Canalys公布数据称，2023年第二季度，全球云基础设施服务支出增长16%，达到724亿美元。由于市场感受到成本压力的影响，增速与上一季度的19%相比有所下降，不过增长放缓也是市场规模扩大的结果。
站长网2023-08-11 09:31:34
0000
站长资讯
Poe推出新功能Image Remix 用户可修改和定制AI生成的图片
Poe最近推出了一个名为ImageRemix的新功能，让用户可以随心所欲地修改和定制AI生成的图片。这项功能包括改变图片的风格、布局和颜色等，让用户能够根据自己的喜好创建更个性化的图片。产品入口:https://top.aibase.com/tool/poe
站长网2024-02-04 14:07:01
0003
站长资讯
Open-Sora悄悄升级支持16秒视频生成和720p分辨率
Open-Sora在开源社区悄悄更新了，现在，该项目不仅支持长达16秒的单镜头视频生成，而且视频分辨率最高可达720p，能够处理各种宽高比的文本到图像、文本到视频、图像到视频、视频到视频以及无限长视频的生成需求。技术报告与模型架构:Open-Sora技术报告已在GitHub上发布，详细介绍了新功能和模型架构。作者团队对STDiT架构进行了关键性改进，提高了模型的训练稳定性和整体性能。
站长网2024-04-26 00:47:35
0000