Allen人工智能研究所推开源模型LLM OLMo 提供模型数据、训练代码等
站长网2024-02-02 10:48:594阅
Allen人工智能研究机构在Hugging Face和GitHub上发布了首个开放语言模型OLMo,意在通过提供数据、代码、模型和评估工具的开放访问,促进人工智能领域的共同研究。
这一举措的首批模型包括7B和1B规模的变体,覆盖不同架构和训练硬件,为未来更大规模、指令调整等模型的发布奠定基础。每个模型都提供全面的训练数据、权重、代码和评估工具,并在Apache2.0许可证下发布,鼓励合作构建全球最佳的开放语言模型。

截图来自官方
为了创建强大的开放模型,A12在设计中吸取了多个开放和部分开放模型的经验教训,包括EleutherAI的Pythia Suite、MosaicML的MPT模型、TII的Falcon模型和Meta的Llama系列。
对OLMo7B型号进行的评估显示,在生成任务和阅读理解上,它在许多任务上领先于Llama2,但在一些流行的问答任务上略显落后。通过与不同模型进行比较,OLMo展现出自己的优势和劣势,成为Llama2等流行模型的有力替代品。
在技术方面,OLMo的架构遵循了最新文献的趋势,包括不使用偏差、SwiGLU激活函数、Rotary位置嵌入(RoPE)等。通过一系列实验和调整,AI2发布了OLMo的第一个版本,并鼓励阅读技术报告以深入了解模型架构和培训方法。
未来,A12计划在OLMo家族中推出不同模型尺寸、模态、数据集、安全措施和评估方法,以共同构建全球最佳的开放语言模型。
OLMo的推出标志着AI2在开放研究领域的重要一步,其框架和模型的开放性为学者和研究人员提供了广泛的研究问题,推动了人工智能领域的不断发展。通过提供权重的开放访问,并鼓励合作,Allen致力于共同构建全球最卓越的开放语言模型,助力人工智能技术的进步。
0004
评论列表
共(0)条相关推荐
荣耀MagicOS 9.0开启内测招募:Magic6/V3系列等5款机型可升级
快科技10月21日消息,荣耀官方预告,MagicOS9.0发布会及开发者大会将于10月23日-10月24日在北京举行,这是行业首个搭载跨应用开放生态智能体的全场景AI操作系统。现在荣耀正式开启MagicOS9.0内测招募活动,包括荣耀MagicV3、荣耀MagicVs3、荣耀MagicV2系列、荣耀Magic6系列、荣耀Magic5系列等等。0000马斯克的Grok已经可以在xAI网站上单独访问
马斯克开发的Grok现在已经可以在xAI网站上单独访问。这个工具在xAI平台上的功能比之前在推特上展示的版本更加丰富。特别值得一提的是它的分支树模式,这个模式允许用户观察多轮对话中可能产生的不同回答路径,这对于分析和理解对话流程非常有用。如果你对使用Grok感兴趣,可以通过xAI的IDE(集成开发环境)入口进行访问。站长网2024-06-05 16:45:050000中端神机!Redmi Note系列全球销量突破3.38亿台
快科技9月21日消息,小米集团卢伟冰表示,RedmiNote系列全球销量突破3.38亿台,成为中端爆款。回顾RedmiNote系列进化史,Redmi将很多旗舰级的体验普及到了Note系列机型上。站长网2023-09-21 20:55:310000微软Azure发布GPT-RAG,为LLM部署提供超智能解决方案
**划重点:**1.🛡️**安全第一:**GPT-RAG具备强大的安全框架,遵循零信任原则,确保敏感数据得到谨慎处理,为企业提供超级安全保障。2.🔄**自适应扩展:**该解决方案能够自动调整大小,即使在高峰期也能保持良好性能,确保在繁忙时刻仍然平稳一致。0000新式市集,贩卖的是社交
继音乐节、livehouse之后,年轻人的潮流聚集地又多了一种。各式各样的新式市集不断在各地涌现,凭借新潮的名字、不同品类的摊主和乐队等丰富表演形式,迅速成为年轻人的新一代打卡地。如今的市集,相较于传统市集而言,主打一个“潮”字,摊主中不乏“独立小众品牌的主理人”、“各大社交平台的时尚潮流KOL”亦或是“文化艺术行业的知名博主”,而来“赶集”的年轻人,既要提前准备好穿搭。又要做好赶集攻略。站长网2023-08-09 20:03:250000