Meta推新语言模型Toolformer:通过自主调用工具“击败” GPT-3
Facebook 母公司 Meta 的人工智能研究人员推出了一种新的语言模型Toolformer,旨在处理自然语言处理用例中多个 API的调用。
Toolformer 基于 GPT-J,后者是一种67亿参数的开源语言模型。Meta 的研究人员为该模型配备了一系列工具,它可以自主使用这些工具来完成任务,例如预测文本或回答数学问题。
Toolformer 可以访问的工具包括一个计算器、一个问答系统、两个不同的搜索引擎、一个机器翻译系统和一个日历。
其中,使用的机器翻译系统是其NLLB模型的6亿参数版本,适用于200种语言。Toolformer 使用日历 API,在查询时无需任何输入即可返回当前日期。回答问题系统使用的是 Meta 的Atlas模型。
值得注意的是,其搜索引擎之一是维基百科搜索,它会在出现提示时返回来自维基百科的短文本片段。
上面的示例展示了 Toolformer 的功能。该模型自主决定调用不同的 API 来获取对完成一段文本有用的信息。Meta论文中的这个例子看到该模型利用了一个问答系统、一个计算器、一个机器翻译系统和一个维基百科搜索引擎。
尽管底层模型基于 GPT-2模型,但 Meta 发现 Toolformer 在少数零样本 NLP 任务上可以胜过 GPT-3模型。虽然 GPT-3在问答方面表现更好,但 Toolformer 在大多数其他测试中击败了 OpenAI 模型,包括数学推理和机器翻译。
Toolformer 类似于 OpenAI 的ChatGPT,用户输入自然语言提示,系统生成响应。Toolformer 的不同之处在于,它的各种工具可用于通过搜索引擎功能等工具根据最近发生的事件生成响应。ChatGPT 和其他人是使用的是截止某个时间点数据集构建的,这意味着它们无法响应用户对最近事件的查询。
Meta 的研究人员在他们的论文中承认,Toolformer 比其同时代的 ChatGPT 更不完整,其目前在使用上仍存在局限性”。
关于Toolformer论文介绍网址:https://arxiv.org/abs/2302.04761
小米澎湃OS 2曝光:主攻方向是AI
快科技8月3日消息,博主数码闲聊站爆料,{tag_keyurl_2}2新系统的主攻方向是AI,这次澎湃OS将会在全场景贯彻落地AI功能。目前AI功能已在澎湃OS上线,比如小米14Ultra首发的AI大模型计算摄影平台XiaomiAISP。站长网2024-08-04 09:30:100000李彦宏宣布将设立10亿创投基金促进大模型生态 同时启动“文心杯”创业大赛
在摩根大通全球中国峰会期间,百度创始人、董事长兼首席执行官李彦宏宣布,百度将设立10亿元人民币的百度文心投资基金,旨在推动大模型生态繁荣,同时启动"文心杯"创业大赛,最高奖项为价值1000万元早期投资。据介绍,本次创业大赛于5月31日正式启动,参赛团队需专注于AIGC、大模型创新应用方向,大赛将为参赛团队开放文心大模型相关能力及百度智能云算力资源。站长网2023-05-31 14:51:450000微信提醒:微信支付“百万保障”不存在“到期续保”
今日午间,微信官方发布提醒称,微信支付“百万保障”完全免费,不存在“到期续保”,不要相信任何“百万保障”缴费续保、影响征信的骗局。微信表示,微信支付“百万保障”由财付通与中国人保财险PICC联合承保,用于保障用户的资金安全。这项保障完全免费、默认开通,只要用户在使用微信支付期间,发生微信支付账户被他人盗用而导致资金损失的情况,均可申请赔付,每年申请赔付金额最高100万元。站长网2023-04-14 14:07:260001AI概念股大幅增长之后,投资大牛向投资者发出警告
纳斯达克(Nasdaq)宣布将对纳斯达克100指数进行特殊调整,因为苹果、微软、谷歌的母公司Alphabet、亚马逊、英伟达和特斯拉等股票的快速增长导致它们在指数中的权重突破了50%。预计指数将被重新调整,以将它们的影响降低到约40%。站长网2023-07-12 09:10:020000Prompt:几行乱码让大模型获得科学思维,这个神奇的提示词突然火了
再等等,作者会解释。起猛了?不过两三天的时间,仅有两个Markdown文件的GitHub项目为何竟能收获2kstar?仔细一看,其中一个Markdown文件是一个流程图,另一个Readme文件的主要内容则是一大篇大模型提示词(prompt。而如果你细读这个prompt,却发现里面仅有寥寥数句人类能懂的话,其余都是一些奇怪的XML标签、符号与函数定义。站长网2024-09-07 12:48:230000