微软推出全新预训练模型phi-1.5 仅13亿参数常识推理碾压Llama2
站长网2023-09-18 10:01:440阅
要点:
1、微软研究人员推出了一个仅有13亿参数的LLM模型Phi-1.5。
2、Phi-1.5在常识推理任务上表现优异,优于多个参数量十倍以上的模型。
3、研究表明,模型参数规模不是决定性因素,高质量数据更为重要。
微软研究人员最近在一篇论文中提出了一个新的语言模型Phi-1.5,该模型的参数量仅有13亿。研究人员主要关注Phi-1.5在常识推理方面的表现,因为这是对语言模型能力的重要考验。
论文地址:https://arxiv.org/abs/2309.05463
项目地址:https://huggingface.co/microsoft/phi-1_5
结果表明,Phi-1.5在多个常识推理基准测试数据集上都取得了与参数量是其10倍以上的模型相当或更好的结果。例如在WinoGrande、ARC-Easy、ARC-Challenge、BoolQ和SIQA等数据集上的表现,都与Llama2-7B、Falcon-7B和Vicuna-13B相当甚至更好。
这说明模型的参数规模不是决定性因素,采用高质量合成数据进行预训练可能更为关键。研究中,Phi-1.5使用了微软之前提出的Phi-1模型的训练数据,以及新增的“教科书级”合成数据进行训练。
结果表明,Phi-1.5不仅展现出许多大模型所具有的语言理解和推理能力,在控制有害内容生成方面也具有一定优势,这对研究大型语言模型的社会影响意义重大。本研究表明,相比单纯追求模型规模,如何获取高质量训练数据可能更为重要,这为未来语言模型研究提供了新的思路。
0000
评论列表
共(0)条相关推荐
钉钉正式登陆苹果Vision Pro 推出 Vision Pro 原生应用
站长之家(ChinaZ.com)2月4日消息:钉钉宣布正式登陆AppleVisionPro,并推出了专为该设备打造的原生应用。用户现在可以在美区AppStore下载DingTalkApp,通过VisionPro的沉浸式环境体验钉钉的各种功能,如聊天、会议和直播等。站长网2024-02-04 10:48:160000BuzzFeed 称其AI生成的内容的表现优于人类员工
BuzzFeed表示通过AI辅助发布的内容比起传统方式受到了更多阅读者的青睐,读者阅读时间时间增加了40%。此举引起了媒体的关注,因为BuzzFeed上个月刚关闭了新闻部门并裁掉了约120个员工。0000苹果正式发布首个空间计算设备 Vision Pro 和全新 visionOS 系统
苹果公司今天正式发布了首款混合现实头显设备「VisionPro」以及全新的设备操作系统visionOS。站长网2023-06-06 16:24:440000《英雄联盟》人机“智商”将升级:会打野抢龙了
快科技5月1日消息,近日,《英雄联盟》官方发布开发者日志,预告了将要在后续版本中上线的人机玩法升级。根据开发者日志中的描述,在过去几个月,《英雄联盟》的开发团开始重新升级游戏的人机系统,主要优化如下:-会打野、抓人和抢龙的人机;-让人机的配合更有策略性、更团结;-能够响应环境变化的人机;-扩展人机英雄池;-会团队配合的人机;站长网2023-05-01 16:08:420000北京发布《加快通用人工智能产业发展若干措施》5年内投资超过1000亿元
在2024年中关村论坛年会“未来人工智能先锋论坛”上,北京市发布了《北京市关于加快通用人工智能产业引领发展的若干措施》,提出了10条措施,涵盖了提升智能算力供给、强化产业基础研究、支撑高质量要素聚集、加快大模型创新应用、打造一流发展环境等5大方面。北京市将通过优化投融资环境,协同社会资本和国家级基金,在5年内投资超过1000亿元,同时积极推动人工智能核心企业优先在北交所上市。0000