微软研究人员用儿童故事进行训练:微型语言模型进入成熟期
站长网2023-10-09 16:13:260阅
站长之家(ChinaZ.com) 10月9日消息:学习英语并不容易,许多学生都深有体会。但当学生是一台计算机时,有一种方法表现出奇地出色:只需将大量来自互联网的文本输入到一个名为神经网络的巨大数学模型中。
这就是生成式大语言模型(如 OpenAI 的 ChatGPT)的工作原理,这些模型能够在各种主题上进行连贯(尽管不总是真实)的对话,令研究人员和公众在过去的一年中感到惊讶。
但这种方法也有其缺点。首先,将大量文本档案转化为最先进的语言模型所需的「训练」过程既昂贵又耗时。其次,即使是训练大型语言模型的人们也很难理解它们的内部工作原理;这反过来又使得难以预测它们可能出现的许多问题。
面对这些困难,一些研究人员选择对较小的数据集上的较小模型进行训练,然后研究它们的行为。布朗大学的语言模型研究员 Ellie Pavlick 表示:「这就像测序果蝇基因组与测序人类基因组一样。」
现在,在最近发布在科学预印本服务arxiv.org 上的一篇论文中,两名微软研究人员介绍了一种训练微小语言模型的新方法:用儿童故事来训练它们。
机器学习研究人员已经接受了这一教训。驱动 ChatGPT 界面的大型语言模型 GPT-3.5 拥有近 2000 亿个参数,它是在包含数千亿个词汇的数据集上训练的。(OpenAI 尚未公布其继任者 GPT-4 的相应数据。)训练如此大型的模型通常需要至少 1000 个并行运行数周的专用处理器(称为 GPU)。只有少数公司能够调集必要的资源,更不用说训练和比较不同模型了。
这两名研究人员展示了,与今天的最先进系统相比,比这些系统小数千倍的语言模型在这种方式下能够迅速学会讲述一致和符合语法的故事。他们的研究结果暗示了可能有助于训练更大型模型并理解其行为的新研究方向。
0000
评论列表
共(0)条相关推荐
荣耀手表5上架并开放预订:将于10月30日正式发布
荣耀品牌即将在10月30日的荣耀Magic7系列旗舰新品发布会上正式发布新款智能手表荣耀手表5。目前,这款智能手表已在荣耀商城上架,并开放了意向预订。0000荣耀畅玩50正式开售:1199元起 配备5200mAh电池
站长之家(ChinaZ.com)4月19日消息:荣耀畅玩50正式开售,该机搭载高亮清晰灵动大屏,售价1199元起。拥有6GB128GB和8GB256GB两个版本可选,售价分别为1199元和1399元。据介绍,荣耀畅玩50配备了天玑6100处理器,CPU组成为2x2.2GHzA76核心和6x2.0GHzA55核心,GPU为MaliG57MC2。站长网2024-04-19 11:39:570000LAION呼吁欧盟鼓励开源AI模型应用
要点:1、AI组织LAION在给欧洲议会的公开信中建议,AI领域的监管努力应该鼓励使用开源AI模型。2、LAION表示,相比封闭源模型,开源AI模型因其透明性具有更大的安全性、问责制、可复制性和鲁棒性。3、LAION还推出了OpenLM,这是一个用于高效训练中型语言模型的PyTorch代码库,其性能优于类似的开源模型。站长网2023-09-27 10:04:000000研究发现,信仰上帝的人更容易接受人工智能的建议
一项由纳扎尔巴耶夫大学和杜克大学进行的联合研究发现,相信上帝的人更愿意相信人工智能(AI)的建议,而不是人类的建议。具体来说,研究人员探讨了“上帝”在决策中的显着性作用,以及思考上帝是否会让人们更愿意或更不可能信任人工智能系统而不是人类专家。”站长网2023-08-21 22:16:460001理想MEGA开放预订 订金5000元
理想MEGA现已在官网开放预订,消费者需支付5000元预定金。该车型的正式售价将在2023年12月的发布会上公布。预订时间为2023年11月17日9:40至2024年1月12日23:59,消费者需在此期间预订。订单确认定购的截止时间是2024年1月31日23:59,按照预定金的支付时间顺序,厂商将安排生产和交付。站长网2023-11-17 10:26:030000