邢波团队提出全开源倡议LLM360 让大模型实现真正的透明

站长网2023-12-13 22:00:380阅

要点:

LLM360是邢波团队提出的全方位开源倡议，旨在使大型语言模型的训练过程真正透明，包括训练数据、代码、模型检查点和性能指标等全方位开放。

LLM360的框架包括训练数据集与处理代码、训练代码与配置、模型检查点以及性能指标，提供了标准以确保更好地在社区中流通与共享，推动人工智能领域的开放合作研究。

研究者通过LLM360框架发布了两个大型语言模型:AMBER和CRYSTALCODER，详细揭示了它们的开发细节、评估结果以及对于LLM研究的经验和教训。AMBER在性能上相对较强，CRYSTALCODER在语言和代码任务之间取得平衡。

开源模型在人工智能领域展现强大活力，但闭源策略限制了LLM（大型语言模型）的发展。邢波团队提出的LLM360全面开源倡议旨在解决这一问题。该框架明确了包括训练数据、代码、模型检查点和性能指标在内的各方面细节，为当前和未来的开源模型树立了透明度的样本。

论文地址:https://arxiv.org/pdf/2312.06550.pdf

项目网页:https://www.llm360.ai/

博客:https://www.llm360.ai/blog/introducing-llm360-fully-transparent-open-source-llms.html

LLM360的核心组成部分包括训练数据集、训练代码与配置、模型检查点以及性能指标。这一全方位的开源使得研究者可以更好地在社区中分享与流通，推动人工智能领域的开放合作研究。同时，LLM360框架下发布的AMBER和CRYSTALCODER是两个从头开始预训练的大型语言模型，为研究者提供了开发经验和性能评估结果。

AMBER是基于1.3T token进行预训练的7B英语语言模型，性能相对较强。而CRYSTALCODER是基于1.4T token训练的7B语言模型，在语言和代码任务之间取得了很好的平衡。这两个模型的开源不仅提供了性能评估结果，还为整个LLM领域的研究提供了实质性的经验和教训。

总体而言，LLM360的提出为大型语言模型的透明训练提供了一个标准，推动了开源模型的发展，加速了人工智能领域的进步。这一全面开源的趋势有望促进更多研究者的参与与合作，推动人工智能技术的不断创新。

邢波团队提出全开源倡议LLM360让大模型实现真正的透明

0000

评论列表

共(0)条

相关推荐

站长资讯
在笔记本电脑上从头设计一款会走路的机器人，AI只需26秒
受自然界进化设计的启发，使用进化算法的机器人自动化设计已经尝试了二十年，但效率仍然低下。现在，从一块肥皂状物质到成功步行的机器人，AI的整个设计过程在笔记本电脑（消费级硬件）上只用了26秒。
站长网2023-10-07 09:02:33
0000
站长资讯
雷军：小米SU7正在快速提升产能着急购车智界S7等都不错
今日下午，小米的领军人物，董事长兼CEO雷军，在社交媒体上发文，看似是对上午流传的“华为‘截胡’小米SU7订单”传闻的回应。雷军在文中提到，小米SU7的产能和交付速度正在迅速提升，标准版和Max版本甚至已经提前交付给了用户。他还透露，许多准车主在小米汽车App中发现，车辆的预计交付时间已经提前。雷军还预告说:“在北京车展上，我会详细分享我们的产能和交付计划。”
站长网2024-04-22 17:06:52
0000
站长资讯
董宇辉回应清空账号：电话被打爆希望能潜下心做一些事
站长之家(ChinaZ.com)2月28日消息:近日，知名人士董宇辉清空个人微博账号的消息引发网友广泛热议。在“与辉同行”的直播中，董宇辉对此事进行了回应。董宇辉表示，自己无法解决被误解的问题，只能选择逃离微博这一社交平台。他强调，虽然自己的账号没有注销，但已很少发微博，希望网友能够继续关注并批评，但不要掐头去尾地误解一个人。
站长网2024-02-28 08:20:40
0000
Patronus AI发现领先AI系统存在“令人担忧”的安全漏洞
**划重点:**1.🕵️‍♂️**SimpleSafetyTests发布:**PatronusAI发布了名为SimpleSafetyTests的新诊断测试套件，揭示了像ChatGPT等流行AI系统中的关键安全漏洞。2.📉**AI系统安全性:**测试涵盖了自杀、儿童虐待和身体伤害等五个高优先级危害领域，揭示了11个受试开源LLM中存在的严重弱点。
站长网站长资讯2023-12-20 15:24:26
0000
站长资讯
斯嘉丽起诉AI开发商上热搜后者擅自使用肖像声音进行推广
好莱坞女演员斯嘉丽・约翰逊对一款未经授权的人工智能应用进行了法律诉讼。这款名为LisaAI:90sYearbook&Avatar的AI图像生成应用在推特上分享了一则22秒的广告，其中使用了约翰逊的名字和肖像。约翰逊的律师指出，广告中出现了约翰逊的画面和声音，推销了该AI应用。此类未经授权使用名人名字和肖像的情况在加利福尼亚等地被视为侵犯隐私，可进行民事索赔。
站长网2023-11-02 09:44:15
0000