邢波团队提出全开源倡议LLM360 让大模型实现真正的透明
要点:
LLM360是邢波团队提出的全方位开源倡议,旨在使大型语言模型的训练过程真正透明,包括训练数据、代码、模型检查点和性能指标等全方位开放。
LLM360的框架包括训练数据集与处理代码、训练代码与配置、模型检查点以及性能指标,提供了标准以确保更好地在社区中流通与共享,推动人工智能领域的开放合作研究。
研究者通过LLM360框架发布了两个大型语言模型:AMBER和CRYSTALCODER,详细揭示了它们的开发细节、评估结果以及对于LLM研究的经验和教训。AMBER在性能上相对较强,CRYSTALCODER在语言和代码任务之间取得平衡。
开源模型在人工智能领域展现强大活力,但闭源策略限制了LLM(大型语言模型)的发展。邢波团队提出的LLM360全面开源倡议旨在解决这一问题。该框架明确了包括训练数据、代码、模型检查点和性能指标在内的各方面细节,为当前和未来的开源模型树立了透明度的样本。
论文地址:https://arxiv.org/pdf/2312.06550.pdf
项目网页:https://www.llm360.ai/
博客:https://www.llm360.ai/blog/introducing-llm360-fully-transparent-open-source-llms.html
LLM360的核心组成部分包括训练数据集、训练代码与配置、模型检查点以及性能指标。这一全方位的开源使得研究者可以更好地在社区中分享与流通,推动人工智能领域的开放合作研究。同时,LLM360框架下发布的AMBER和CRYSTALCODER是两个从头开始预训练的大型语言模型,为研究者提供了开发经验和性能评估结果。
AMBER是基于1.3T token进行预训练的7B英语语言模型,性能相对较强。而CRYSTALCODER是基于1.4T token训练的7B语言模型,在语言和代码任务之间取得了很好的平衡。这两个模型的开源不仅提供了性能评估结果,还为整个LLM领域的研究提供了实质性的经验和教训。
总体而言,LLM360的提出为大型语言模型的透明训练提供了一个标准,推动了开源模型的发展,加速了人工智能领域的进步。这一全面开源的趋势有望促进更多研究者的参与与合作,推动人工智能技术的不断创新。
一加12搭载超光影潜望长焦 支持3倍光学变焦
一加宣布,一加12新机在镜头方面实现了升级,采用了成本更贵且画质更优秀的潜望长焦镜头。这是同档位中最强的长焦镜头。一加12的潜望长焦镜头采用了光学波浪纹设计和纳米级镜头边切工艺,显著降低了成像杂光干扰并提升了镜头光学性能。此外,这颗潜望长焦拥有1/2英寸底,像素达6400万,支持3倍光学变焦、F/2.6大光圈、光学防抖功能,能够呈现清晰的光影细节。站长网2023-11-09 16:25:230000在朋友圈刷“直播”,电商引流又增新玩法
对于广大网友来说,每天打开手机,刷刷短视频,浏览朋友圈,成为了一天中放松的小休闲。尤其是微信生态,承载了用户各种各样的需求。腾讯2023Q3财报显示,微信月活跃用户数突破13亿,小程序交易额增加40%,视频号总播放量增加50%,搜一搜月活跃用户量也突破8亿。数据基础,令人叹服。在微信生态各商业触点有机协同之下,朋友圈引流又增加了新玩法。站长网2024-01-16 14:33:440000苹果2026年或将销售可折叠iPhone 仍在秘密推进该项目
尽管曾有传闻称苹果因对折叠屏耐用性的担忧而暂停了可折叠iPhone的研发,但最新消息显示,这家科技巨头仍在秘密推进该项目。据AlphaBiz从接近苹果内部计划的人士处获悉,苹果正积极研发可折叠iPhone,并计划于2026年9月或10月左右推向市场。站长网2024-02-20 17:27:290000锐步跟随 Nike 进军数字时尚和游戏领域 并加入人工智能技术
锐步与加密技术初创公司Futureverse建立了独家合作伙伴关系,旨在将锐步的品牌影响力扩展到虚拟领域,并“彻底改变数字世界的时尚”。此次合作将重点开发人工智能和区块链支持的游戏和数字体验。明年,Reebok和Futureverse将推出“ReebokImpact”,这是一种“令人心旷神怡的数字鞋体验”,它将结合人工智能技术和链上数字可穿戴设备。站长网2023-12-08 15:16:240000游戏大厂的夏日团建:出海、文化输出、与刘震云当“邻居”
这个夏天,图博会回来了。6月15日至18日,第二十九届北京国际图书博览会于国家会议中心举办。相比往届,有一处变化格外引人注意:图博会专门将一大片展厅区域开辟为“网络出版馆”。从1986年至今,图博会还是首次进行这样的尝试。仔细看,网络出版馆的参展阵容有些特别。站长网2023-06-24 14:17:050000