Allen AI开源微调模型OLMo-7B-Instruct
站长网2024-02-29 10:04:490阅
Allen AI最近宣布开源了微调模型OLMo-7B-Instruct,这是一个真正意义上的开源项目。该模型是基于AI2的Dolma数据集构建的,该数据集包括了用于语言模型预训练的三万亿标记的开放语料库,还包括生成训练数据的代码。

官网:https://allenai.org/olmo
项目页:https://top.aibase.com/tool/olmo
此外,OLMo框架还包括四种7B规模模型变体的完整模型权重,每个模型至少训练了2T个标记。推理代码、训练指标和训练日志也都已提供,让用户可以轻松复刻微调过程。
为了帮助用户更好地评估模型性能,Allen AI还发布了用于开发中使用的评估套件。每个模型在训练过程中每1000步都有500多个检查点,并且提供了在Catwalk项目框架下的训练和评估代码。
这一系列的开源内容将使用户能够全面了解从预训练模型到RLHF微调模型的整个过程,为他们的研究和实践提供了强大的支持。Allen AI的举措为开源社区提供了更多可能性,促进了模型研究和应用的发展。
0000
评论列表
共(0)条相关推荐
AI几小时设计芯片超越人类!谷歌AlphaChip登Nature,已设计出三代旗舰TPU
【新智元导读】谷歌的AlphaChip,几小时内就能设计出芯片布局,直接碾压人类专家!这种超人芯片布局,已经应用在TPU、CPU在内的全球硬件中。人类设计芯片的方式,已被AI彻底改变。能设计芯片的AI黑科技来了!就在刚刚,谷歌DeepMind推出名为AlphaChip的AI系统。无论是设计最先进的用于构建AI模型的TPU,还是数据中心的CPU,它在相关的众多领域,都产生了广泛影响。站长网2024-09-30 20:58:440000人脸识别技术应用安全管理规定公布:在公共场所使用人脸识别应备案
据网信中国消息,为规范人脸识别技术应用,国家互联网信息办公室起草了《人脸识别技术应用安全管理规定(试行)(征求意见稿)》,现向社会公开征求意见。意见反馈截止时间为2023年9月7日。规定明确,只有在具有特定的目的和充分的必要性,并采取严格保护措施的情形下,方可使用人脸识别技术处理人脸信息。实现相同目的或者达到同等业务要求,存在其他非生物特征识别技术方案的,应当优先选择非生物特征识别技术方案。站长网2023-08-08 08:54:300002抖音开放平台宣布开放抖音小程序核销工具解决方案
今日,抖音开放平台宣布开放抖音小程序核销工具解决方案,帮助生服商家更好的解决核销问题,提升经营效率。核销工具是消费者在抖音购买团购券后,直接可在抖音小程序内核销团购券的工具。它可帮助商家实现“原生团购卖券——>抖音小程序核销团购券”的链路。站长网2023-05-26 15:38:070003Slack对话功能仅对付费用户开放Claude服务
近日,多名网友在表示在Slack上使用Claude时其服务受到限制,提示仅对付费用户开放。在用户的眼中,Slack上的Claude对话一直是工作和娱乐不可或缺的一部分,而现在这一服务的限制让一些免费用户感到困扰。多名网友纷纷表示,他们习惯在Slack上与Claude互动,而这次变更意味着这一便利性将仅对付费用户开放。站长网2023-11-10 11:57:370001Canalys预测:2024年全球个人电脑市场将增长8% 具备AI功能个人电脑将占约19%市场份额
划重点:1.🌐全球个人电脑市场连续七个季度下跌后预计将迎来5%的复苏,2024年全年出货量预计将增长8%。2.🔄复苏得益于节日旺季、宏观经济改善以及Windows更新周期,同时具备AI功能和采用Arm架构电脑的兴起也是增长的主要因素。站长网2023-12-05 09:30:190000