微软推出全新预训练模型phi-1.5 仅13亿参数常识推理碾压Llama2
站长网2023-09-18 10:01:440阅
要点:
1、微软研究人员推出了一个仅有13亿参数的LLM模型Phi-1.5。
2、Phi-1.5在常识推理任务上表现优异,优于多个参数量十倍以上的模型。
3、研究表明,模型参数规模不是决定性因素,高质量数据更为重要。
微软研究人员最近在一篇论文中提出了一个新的语言模型Phi-1.5,该模型的参数量仅有13亿。研究人员主要关注Phi-1.5在常识推理方面的表现,因为这是对语言模型能力的重要考验。

论文地址:https://arxiv.org/abs/2309.05463
项目地址:https://huggingface.co/microsoft/phi-1_5
结果表明,Phi-1.5在多个常识推理基准测试数据集上都取得了与参数量是其10倍以上的模型相当或更好的结果。例如在WinoGrande、ARC-Easy、ARC-Challenge、BoolQ和SIQA等数据集上的表现,都与Llama2-7B、Falcon-7B和Vicuna-13B相当甚至更好。
这说明模型的参数规模不是决定性因素,采用高质量合成数据进行预训练可能更为关键。研究中,Phi-1.5使用了微软之前提出的Phi-1模型的训练数据,以及新增的“教科书级”合成数据进行训练。
结果表明,Phi-1.5不仅展现出许多大模型所具有的语言理解和推理能力,在控制有害内容生成方面也具有一定优势,这对研究大型语言模型的社会影响意义重大。本研究表明,相比单纯追求模型规模,如何获取高质量训练数据可能更为重要,这为未来语言模型研究提供了新的思路。
0000
评论列表
共(0)条相关推荐
支付宝官宣2025年集五福1月20日正式开启
站长之家(ChinaZ.com)1月16日消息:1月15日,支付宝正式对外宣布,备受关注的“2025年集福”活动将于1月20日正式启动,为广大用户带来全新的集福体验。站长网2025-01-16 09:35:120000会颠勺的国产机器人来了!星尘智能推AI机器人Astribot S1 家务活全包
随着人工智能向通用人工智能(AGI)目标加速发展,星尘智能公司最新研发的AI机器人AstribotS1,以其卓越的操作性能,在同规格机器人中脱颖而出。AstribotS1在未经加速的1倍速视频中,展示了其在家居和工作场景中的多任务能力,包括叠衣、分拣物品、颠锅炒菜、吸尘清洁和竞技叠杯等。AstribotS1的核心特点:站长网2024-04-27 17:40:450000TikTok 可能在下个月推出在线商店
站长之家(ChinaZ.com)6月29日消息:据Semafor报道,TikTok正在为美国客户准备一家网上商店。该店面将位于TikTok应用程序的电子商务选项卡下。一系列精选商品以及通过TikTokShop(其现有的应用内购物功能)列出的待售产品都将出售。该功能最早可能在下个月推出。站长网2023-06-29 19:26:340000金山官方发布中文官方版GPT——WPS AI
金山办公室也发布了中文办公室官方版GPT——WPSAI,将搭载到金山办公新一代在线内容协作编辑产品——轻文档上,而在未来,WPSAI将嵌入金山办公全线产品。细节:WPSAI将嵌入金山办公全线产品,未来将为用户提供更多智能化的办公体验。WPSAI的大型模型由国内合作伙伴MiniMax提供,后续能力预测未来几周可以继续并用户看到。站长网2023-04-19 14:20:150000韩国互联网巨头Naver推出生成式AI服务 提供AI搜索功能
文章概要:1.韩国互联网巨头Naver于8月24日推出自己的生成式AI工具HyperCLOVAX。2.HyperCLOVAX包括聊天机器人应用CLOVAX和生成式AI功能Cue,用于改进网际快车的搜索、网购和导航服务。3.Naver计划从8月24日开始CLOVAX的公开测试,9月启动Cue的测试。站长网2023-08-24 23:45:450000