微软Orca 2完胜!推理能力与5-10倍大小的模型相当
站长网2023-11-23 14:44:453阅
要点:
1、Orca2是一个13亿参数的语言模型,通过增强的训练信号提高了小型语言模型的推理能力,与5-10倍于其大小的模型相比具有相当甚至更好的性能。
2、Orca2旨在教导小型语言模型利用一系列推理技巧,并帮助其确定适合特定任务的最有效推理策略。
3、Orca2通过采用谨慎推理技术,即 Prompt Erasure,不仅可以执行具体的推理步骤,还可以在更高层面上制定任务处理策略。
微软研究团队推出的13亿参数模型 Orca2在近期发布的一篇论文中探索了如何提升小型语言模型的推理能力。通过增强的训练信号,Orca2能够在与其大小相似的模型中取得与5-10倍更大的模型相媲美甚至更好的性能。
Orca2的目标是教导小型语言模型采用一系列推理技巧,并帮助其确定对于特定任务最有效的推理策略。与其前身 Orca1类似,研究团队借鉴了更强大的大型语言模型的推理策略,并根据小型模型的能力进行了细致调整。
Orca2采用了一种谨慎推理技术,即 Prompt Erasure,使其成为一种谨慎的推理者。这种技术使模型不仅能够执行具体的推理步骤,还能够在更高层面上制定任务处理策略。与盲目模仿强大的大型语言模型不同,研究团队将其视为行为库,从中精心选择适合当前任务的行为。
在实证研究中,研究人员对 Orca2在15个基准测试中进行了全面评估,涵盖了约100个任务和超过36,000个独特提示。结果显示,Orca2在与其大小相似的模型上明显优于它们,甚至在需要高级推理的任务上与5-10倍更大的模型相媲美甚至超过。
这项工作标志着推动小型语言模型推理能力的重要一步。研究团队相信,提升小型模型的能力将为不同的应用部署场景开辟新的可能,并在效率和功能之间找到平衡。
0003
评论列表
共(0)条相关推荐
抖音否认“放弃外卖”:已在北京、上海、成都等6城市全面上线
据科创板日报报道,针对抖音放弃外卖业务的报道,抖音生活服务相关负责人表示该信息不实,抖音团购配送业务正在正常开展中。抖音已经在前期试点的基础上,于今年7月份在北京、上海、成都、广州、长沙和临沂全面上线了团购配送业务,并引入了区域代理模式,9月份第二批城市也将拓展落地。站长网2023-09-04 14:19:250000Epic与微软加强合作,加速推进生成性AI辅助工具
本文概要:1.Epic利用微软的AI专长,推出更多工具帮助医生节省时间,在临床决策点获取关键数据。2.新的AI驱动功能包括医疗记录摘要以支持更快速文档化、编码员基于EHR临床文档提供建议以提高准确性、优化整个编码和计费流程。3.基于AzureOpenAI服务,Epic正在为初始用户群提供SlicerDicer,以利用实际数据弥补临床证据差距。站长网2023-08-24 16:31:160001阿里上线AI电商产品绘蛙 开启淘宝商家邀请测试
据Tech星球报道,阿里巴巴旗下的一支秘密AI电商团队最近浮出水面,他们正在全力打造一款名为“绘蛙”的AI电商产品。据悉,该产品已经启动了对部分淘宝商家的邀请测试阶段。“绘蛙”旨在通过人工智能技术,为淘宝和天猫的商家和达人提供强大的创作支持。无论是生成营销文案,还是训练专属的AI模特,它都能帮助用户显著提升工作效率,让商品迅速吸引消费者的目光。站长网2024-03-04 17:25:010002涨价,是大厂给共享单车亮出的一张“黄牌”
降本增效的大刀紧随其后。以前骑一次一块钱、五毛钱甚至不要钱的共享单车,现在要多少钱?对于部分城市的用户而言,新的收费标准是:每小时六块五。2023年以来,主要共享单车品牌相继在成都、厦门等城市调价。有用户抱怨,如今的共享单车价格已贵过公交,直追地铁。去年上半年,共享单车企业已经历过一轮涨价潮。那轮涨价过后,不购买套餐卡情况下,部分城市共享单车价格已高达6.5元1小时。站长网2023-06-12 23:35:280000Stability AI发布两款日语语言模型
划重点:1.最新发布:StabilityAIJapan发布了两款日语语言模型,分别是“JapaneseStableLM3B-4E1T”和“JapaneseStableLMGamma7B”,前者有30亿参数,后者则拥有70亿参数。这两款模型基于之前发布的英语语言模型构建,后来通过引入大量日语和英语数据进行预训练,提升其日语语言处理能力。站长网2023-10-25 19:41:320000