新加坡国立大学发布Goat 算数能力超过GPT-4
站长网2023-06-07 19:12:160阅
尽管大规模语言模型在各种自然语言处理任务中展现出卓越的性能,但算术类问题仍然是一个难题,即使是目前最强大的GPT-4也很难解决基本的运算问题。
最近,来自新加坡国立大学的研究人员提出了一个专门用于算术问题的模型,名为Goat。在对LLaMA模型进行微调后,Goat在算术上实现了比GPT-4更出色的性能。
通过微调合成的算术数据集,Goat在BIG-bench算术子任务上实现了最先进的性能。通过监督微调,Goat在大数加减运算中实现了准确率近乎完美,超越了之前所有的预训练语言模型,例如Bloom、OPT、GPT-NeoX等。其中,零样本的Goat-7B所达到的精度甚至超过了少样本学习后的PaLM-540。
论文地址:https://arxiv.org/pdf/2305.14201.pdf
研究人员将Goat的卓越性能归功于LLaMA的数字一致性分词技术。
为了解决更具挑战性的任务,例如大数乘法和除法,研究人员提出了一种方法,将任务根据算术的可学习性进行分类,然后利用基本算术原理将不可学习的任务(例如多位数乘法和除法)分解为一系列可学习的任务。通过全面实验验证后,文中提出的分解步骤可以有效地提高算术性能。
此外,Goat-7B可以在24GB VRAM GPU上使用LoRA进行高效训练。而其他研究人员也可以很容易地重复这个实验,因为该模型、数据集和生成数据集的Python脚本即将开源。
0000
评论列表
共(0)条相关推荐
OpenAI 称《纽约时报》版权诉讼毫无根据 数据来自公开渠道
站长之家(ChinaZ.com)1月9日消息:人工智能公司OpenAI日前对《纽约时报》提起的版权诉讼做出公开回应,称利用公开文章等数据训练AI系统属于“合理使用”。0000点餐无障碍 DoorDash人工智能语音订餐上线
美国外卖平台DoorDash今日宣布,已正式推出人工智能语音点餐服务,使用户可以通过拨打电话进行语音订餐。这一举措旨在提供更便捷的订餐体验,尤其是对于习惯使用电话点餐的用户群体。站长网2023-08-29 14:27:200000沉痛!Adobe 之父 John Warnock 博士离世,享年 82 岁:首创 PostScript,一个改变世界的发明
昨日,Adobe公司悲痛地宣布了一则消息:Adobe联合创始人JohnWarnock博士已于上周六去世,享年82岁。作为全球最成功的软件企业之一,Adobe旗下软件几乎遍布各种软件工具领域,其中大家最耳熟能详的可能是Photoshop。0000你的聊天记录有多大?微信官方公布存储空间清理教程
昨日,微信官方公布了存储空间清理教程。微信表示,在微信内依次点击“我-设置-通用”找到存储空间,待系统计算完已用空间后,就能直观看到微信已占用的空间,以及各项数据分别占据的空间大小。在存储空间页面,点击“缓存-前往清理”,这部分临时文件可以直接清理,不影响使用。在存储空间页面,选择“聊天记录-管理”,按照【时间范围】【消息类型】【排序方式】自由筛选,清理。站长网2023-09-01 10:57:130000《黑神话:悟空》发售日,我们记录了66个与它有关的数字
踏平坎坷成大道,斗罢艰险又出发。历经上千个日夜的漫长等待后,北京时间2024年8月20日上午10时,由游戏科学出品、以中国神话为背景的动作角色扮演游戏《黑神话:悟空》如期解锁。在这个令中国游戏圈震动沸腾的日子里,我们尝试记录下66个和这款游戏有所关联的数字,以此见证这颗世人渴盼的奇石,与它所激起的千层波澜万重浪。站长网2024-08-21 08:50:560000