新加坡国立大学发布Goat 算数能力超过GPT-4
站长网2023-06-07 19:12:160阅
尽管大规模语言模型在各种自然语言处理任务中展现出卓越的性能,但算术类问题仍然是一个难题,即使是目前最强大的GPT-4也很难解决基本的运算问题。
最近,来自新加坡国立大学的研究人员提出了一个专门用于算术问题的模型,名为Goat。在对LLaMA模型进行微调后,Goat在算术上实现了比GPT-4更出色的性能。
通过微调合成的算术数据集,Goat在BIG-bench算术子任务上实现了最先进的性能。通过监督微调,Goat在大数加减运算中实现了准确率近乎完美,超越了之前所有的预训练语言模型,例如Bloom、OPT、GPT-NeoX等。其中,零样本的Goat-7B所达到的精度甚至超过了少样本学习后的PaLM-540。
论文地址:https://arxiv.org/pdf/2305.14201.pdf
研究人员将Goat的卓越性能归功于LLaMA的数字一致性分词技术。
为了解决更具挑战性的任务,例如大数乘法和除法,研究人员提出了一种方法,将任务根据算术的可学习性进行分类,然后利用基本算术原理将不可学习的任务(例如多位数乘法和除法)分解为一系列可学习的任务。通过全面实验验证后,文中提出的分解步骤可以有效地提高算术性能。
此外,Goat-7B可以在24GB VRAM GPU上使用LoRA进行高效训练。而其他研究人员也可以很容易地重复这个实验,因为该模型、数据集和生成数据集的Python脚本即将开源。
0000
评论列表
共(0)条相关推荐
报告:2023年第一季度 中国智能手表出货量年同比下降28%
CounterpointResearch发布最新的全球智能手表型号追踪报告显示,2023年第一季度,中国智能手表出货量年同比下降28%,环比下降16%。前三大品牌分别是华为、苹果和小天才(imoo)。2023年第一季度,该三大品牌占据中国智能手表市场近60%的份额。站长网2023-06-01 15:54:560002高德顺风车正式全国上线 上下班顺路捎人挣个停车费、油钱
快科技10月14日消息,据报道,高德正式在全国上线顺风车业务,在本次正式上线之前,高德顺风车进行了为期两个多月的试运营。高德方面表示,顺风车服务作为高德一体化出行平台生态的重要补充,不仅仅是服务层面的拓展,更是高德地图对构建多元化、智能化出行体系愿景的实践,将与现有的驾车、公共交通、打车、骑(步)行等出行方式形成有效互补。0001意大利研究人员开发出一种生成模型 能够进行音乐合成和源分离
一项来自意大利的新的人工智能研究介绍了一种基于扩散的生成模型,能够同时进行音乐合成和源分离。这种模型使用了源的联合概率密度作为先验分布进行训练,通过对先验进行采样来进行生成任务,通过将先验分布与混合物进行条件化并从结果的后验分布中进行采样来进行分离任务。站长网2023-07-21 17:06:410000机器人取消扁平化!安卓将启用新Logo
谷歌近日宣布,他们将启用新版的安卓Logo。据博主MishaalRahman分享的图片显示,新Logo对安卓机器人进行了调整,使其更具立体感。同时,安卓”字体的设计也变得更加紧凑和圆润。这次更新还带来了另一个显著的变化:谷歌决定将字母“A”从原来的小写改为大写。这一改动是为了使新Logo与Google品牌Logo放在一起时显得更有分量感。0000Getty推出人工智能图像生成器
在对人工智能进行了一年多的训练后,图片库盖蒂图片社将允许用户通过其网站使用人工智能生成图像。该公司承诺用户不必担心版权纠纷,因为其人工智能仅接受盖蒂自有图片进行训练。站长网2023-10-01 21:51:090000