Allen AI开源微调模型OLMo-7B-Instruct
站长网2024-02-29 10:04:490阅
Allen AI最近宣布开源了微调模型OLMo-7B-Instruct,这是一个真正意义上的开源项目。该模型是基于AI2的Dolma数据集构建的,该数据集包括了用于语言模型预训练的三万亿标记的开放语料库,还包括生成训练数据的代码。
官网:https://allenai.org/olmo
项目页:https://top.aibase.com/tool/olmo
此外,OLMo框架还包括四种7B规模模型变体的完整模型权重,每个模型至少训练了2T个标记。推理代码、训练指标和训练日志也都已提供,让用户可以轻松复刻微调过程。
为了帮助用户更好地评估模型性能,Allen AI还发布了用于开发中使用的评估套件。每个模型在训练过程中每1000步都有500多个检查点,并且提供了在Catwalk项目框架下的训练和评估代码。
这一系列的开源内容将使用户能够全面了解从预训练模型到RLHF微调模型的整个过程,为他们的研究和实践提供了强大的支持。Allen AI的举措为开源社区提供了更多可能性,促进了模型研究和应用的发展。
0000
评论列表
共(0)条相关推荐
叮当健康发布大模型HealthGPT及医药AI产品
叮当健康于6月28日正式发布了大模型叮当HealthGPT,并推出了基于该模型研发的应用型医药AI产品,其中包括叮当药师和营养师AI助手。叮当快药科技集团总经理杨益斌表示,GPT技术的发展与应用离不开场景、数据和技术三大要素,正是基于这三者的重要性,叮当健康开发了HealthGPT,并在此基础上推出了场景应用型产品叮当药师和营养师AI助手。站长网2023-06-29 12:13:390000高通展示汽车内类似 ChatGPT 的助手功能 希望在汽车芯片市场获得更大份额
高通以手机芯片和调制解调器而闻名。但在近几年,他们也向GM、现代和沃尔沃等汽车制造商销售一套硬件芯片、传感器和软件包,称为SnapdragonDigitalChassis。现在高通希望利用生成式人工智能的热潮,说服汽车制造商购买更多的芯片,并围绕它们构建新场景,例如智能助手可以帮助驾驶员在城市中导航、预订和完成其他日常计算任务。站长网2023-09-01 11:01:570002一加Ace 3V发布 360周鸿祎:AI将让中国手机弯道超车
日前,一加手机盛大发布旗下新品——被誉为“年轻人的第一台AI手机”的一加Ace3V,吸引了业界和消费者的广泛关注。发布会上,一加特邀嘉宾、360集团创始人周鸿祎亲临现场,就AI手机的未来发展发表了独到见解。站长网2024-03-22 10:16:200001《卫报》确认已禁止 ChatGPT 所有者 OpenAI 的 GPTBot 爬虫抓取其内容
《卫报》已经阻止OpenAI从其内容中获取数据。该出版商是最新一家阻止人工智能公司使用其内容来创建ChatGPT等产品的新闻机构。担心OpenAI正在使用未经许可的内容来创建其人工智能工具,已导致作家对该公司提起诉讼,并呼吁创意产业采取措施保护知识产权。站长网2023-09-03 09:04:110000极氪回应重启IPO:已向SEC备案并进行准备工作
快科技4月3日消息,据消息称,极氪已重启其在美国的IPO计划,计划最多融资5亿美元,约合人民币36.25亿元。极氪表示,公司已向美国证券交易委员会(SEC)备案,并正在进行准备工作。据悉,极氪智能科技控股有限公司已向SEC提交了IPO招股书,计划在纽约证券交易所上市,股票代码为ZK”。然而,由于市场环境的不利影响,极氪已暂缓了在美国的IPO计划。站长网2024-04-08 12:41:400000