微软研究人员用儿童故事进行训练:微型语言模型进入成熟期
站长网2023-10-09 16:13:260阅
站长之家(ChinaZ.com) 10月9日消息:学习英语并不容易,许多学生都深有体会。但当学生是一台计算机时,有一种方法表现出奇地出色:只需将大量来自互联网的文本输入到一个名为神经网络的巨大数学模型中。
这就是生成式大语言模型(如 OpenAI 的 ChatGPT)的工作原理,这些模型能够在各种主题上进行连贯(尽管不总是真实)的对话,令研究人员和公众在过去的一年中感到惊讶。
但这种方法也有其缺点。首先,将大量文本档案转化为最先进的语言模型所需的「训练」过程既昂贵又耗时。其次,即使是训练大型语言模型的人们也很难理解它们的内部工作原理;这反过来又使得难以预测它们可能出现的许多问题。
面对这些困难,一些研究人员选择对较小的数据集上的较小模型进行训练,然后研究它们的行为。布朗大学的语言模型研究员 Ellie Pavlick 表示:「这就像测序果蝇基因组与测序人类基因组一样。」
现在,在最近发布在科学预印本服务arxiv.org 上的一篇论文中,两名微软研究人员介绍了一种训练微小语言模型的新方法:用儿童故事来训练它们。
机器学习研究人员已经接受了这一教训。驱动 ChatGPT 界面的大型语言模型 GPT-3.5 拥有近 2000 亿个参数,它是在包含数千亿个词汇的数据集上训练的。(OpenAI 尚未公布其继任者 GPT-4 的相应数据。)训练如此大型的模型通常需要至少 1000 个并行运行数周的专用处理器(称为 GPU)。只有少数公司能够调集必要的资源,更不用说训练和比较不同模型了。
这两名研究人员展示了,与今天的最先进系统相比,比这些系统小数千倍的语言模型在这种方式下能够迅速学会讲述一致和符合语法的故事。他们的研究结果暗示了可能有助于训练更大型模型并理解其行为的新研究方向。
0000
评论列表
共(0)条相关推荐
报告:OpenAI的ChatGPT下载量和应用收入持续增长
ChatGPT的下载量和收入持续增长,这款OpenAI的AI聊天机器人下载量达到2300万次(截至9月份)。据TechCrunch报道,Apptopia对人工智能应用市场的分析显示,5月份在苹果应用商店发布的第一个月,下载量就突破了390万次,到6月份达到了1510万次。站长网2023-10-31 15:29:020000双11 0元领礼品是假的!小米辟谣这种提货卡:压根没这活动
快科技10月23日消息,又是一年一度的双11电商节,很多厂商会在此期间推出各种优惠活动。不过,大家购物的同时也要当心骗子的套路”。今日,小米品牌安全”官微发文,称收到很多关于提货卡的问询,小米未曾做过此类活动。为了大家的个人信息及财产安全,请不要轻信及操作。官方提醒,在未购物的情况下,家中收到各类型提货卡”请谨慎扫码。站长网2023-10-24 21:23:020002蔚来8月新增充电站136座!已实现25978份换电心愿单
快科技9月3日消息,日前,我们从蔚来汽车官方获悉,在刚刚过去的8月里,蔚来汽车共完成了136座换电站的建设,帮助5282名用户在8月实现了换电心愿。作为汽车行业的海底捞”,蔚来汽车一直致力于为客户提供更好的服务。截至至今,蔚来已累计完成25978份心愿单,已填写心愿单的用户中,超过24%的用户有心愿达成。0000入股、整合、价格战,量贩零食进入下半场
2023年,量贩零食成为最炙手可热的明星赛道之一。量贩零食行业发生多起融资,多起融资金额超过千万。一方面,量贩零食行业的行业竞争与整合加剧,赵一鸣零食与零食很忙合并,合并后门店总数突破6500家。行业规模位列量贩零食领域第一与第二的零食很忙集团与万辰集团的“商战”蔓延至社交平台,争夺加盟商,明面开战。站长网2024-02-18 15:52:230002拥有千万粉丝的@大圆哥,有这5个涨粉秘诀
近日,一条题为“爱意随风起,风止意难平,遗憾终究是遗憾”的抖音视频火了,截至目前点赞数接近800万,转发超过300万,评论也有近70万。视频以一种诙谐的方式讲述了爱情的遗憾,也带火了BGM《其实都没有》,网友纷纷在评论区娓娓道出自己的故事,一场情感共振,让视频持续发酵。站长网2023-11-01 11:39:380000