首页站长资讯Allen人工智能研究所推开源模型LLM OLMo 提供模型数据、训练代码等

Allen人工智能研究所推开源模型LLM OLMo 提供模型数据、训练代码等

站长网2024-02-02 10:48:594阅

Allen人工智能研究机构在Hugging Face和GitHub上发布了首个开放语言模型OLMo，意在通过提供数据、代码、模型和评估工具的开放访问，促进人工智能领域的共同研究。

这一举措的首批模型包括7B和1B规模的变体，覆盖不同架构和训练硬件，为未来更大规模、指令调整等模型的发布奠定基础。每个模型都提供全面的训练数据、权重、代码和评估工具，并在Apache2.0许可证下发布，鼓励合作构建全球最佳的开放语言模型。

截图来自官方

为了创建强大的开放模型，A12在设计中吸取了多个开放和部分开放模型的经验教训，包括EleutherAI的Pythia Suite、MosaicML的MPT模型、TII的Falcon模型和Meta的Llama系列。

对OLMo7B型号进行的评估显示，在生成任务和阅读理解上，它在许多任务上领先于Llama2，但在一些流行的问答任务上略显落后。通过与不同模型进行比较，OLMo展现出自己的优势和劣势，成为Llama2等流行模型的有力替代品。

在技术方面，OLMo的架构遵循了最新文献的趋势，包括不使用偏差、SwiGLU激活函数、Rotary位置嵌入（RoPE）等。通过一系列实验和调整，AI2发布了OLMo的第一个版本，并鼓励阅读技术报告以深入了解模型架构和培训方法。

未来，A12计划在OLMo家族中推出不同模型尺寸、模态、数据集、安全措施和评估方法，以共同构建全球最佳的开放语言模型。

OLMo的推出标志着AI2在开放研究领域的重要一步，其框架和模型的开放性为学者和研究人员提供了广泛的研究问题，推动了人工智能领域的不断发展。通过提供权重的开放访问，并鼓励合作，Allen致力于共同构建全球最卓越的开放语言模型，助力人工智能技术的进步。

Allen人工智能研究所推开源模型LLMOLMo提供模型数据训练代码等

0004

评论列表

共(0)条

相关推荐

荣耀MagicOS 9.0开启内测招募：Magic6/V3系列等5款机型可升级
快科技10月21日消息，荣耀官方预告，MagicOS9.0发布会及开发者大会将于10月23日-10月24日在北京举行，这是行业首个搭载跨应用开放生态智能体的全场景AI操作系统。现在荣耀正式开启MagicOS9.0内测招募活动，包括荣耀MagicV3、荣耀MagicVs3、荣耀MagicV2系列、荣耀Magic6系列、荣耀Magic5系列等等。
站长网站长资讯2024-10-21 09:01:00
0000
站长资讯
马斯克的Grok已经可以在xAI网站上单独访问
马斯克开发的Grok现在已经可以在xAI网站上单独访问。这个工具在xAI平台上的功能比之前在推特上展示的版本更加丰富。特别值得一提的是它的分支树模式，这个模式允许用户观察多轮对话中可能产生的不同回答路径，这对于分析和理解对话流程非常有用。如果你对使用Grok感兴趣，可以通过xAI的IDE（集成开发环境）入口进行访问。
站长网2024-06-05 16:45:05
0000
站长资讯
中端神机！Redmi Note系列全球销量突破3.38亿台
快科技9月21日消息，小米集团卢伟冰表示，RedmiNote系列全球销量突破3.38亿台，成为中端爆款。回顾RedmiNote系列进化史，Redmi将很多旗舰级的体验普及到了Note系列机型上。
站长网2023-09-21 20:55:31
0000
微软Azure发布GPT-RAG，为LLM部署提供超智能解决方案
**划重点:**1.🛡️**安全第一:**GPT-RAG具备强大的安全框架，遵循零信任原则，确保敏感数据得到谨慎处理，为企业提供超级安全保障。2.🔄**自适应扩展:**该解决方案能够自动调整大小，即使在高峰期也能保持良好性能，确保在繁忙时刻仍然平稳一致。
站长网站长资讯2023-12-20 14:58:12
0000
站长资讯
新式市集，贩卖的是社交
继音乐节、livehouse之后，年轻人的潮流聚集地又多了一种。各式各样的新式市集不断在各地涌现，凭借新潮的名字、不同品类的摊主和乐队等丰富表演形式，迅速成为年轻人的新一代打卡地。如今的市集，相较于传统市集而言，主打一个“潮”字，摊主中不乏“独立小众品牌的主理人”、“各大社交平台的时尚潮流KOL”亦或是“文化艺术行业的知名博主”，而来“赶集”的年轻人，既要提前准备好穿搭。又要做好赶集攻略。
站长网2023-08-09 20:03:25
0000