麻省理工学院研究:辩论让AI机器人更加聪明
文章概要:
1. MIT研究发现,多智能体辩论可以提高AI模型的准确性和推理能力。
2. 辩论方法减少了幻觉,帮助模型增强响应能力。
3. 研究团队发现,让多个AI系统辩论问题的答案比仅使用单个AI系统可以提高响应的准确性。
麻省理工学院(MIT)的研究人员发现,相较于仅使用单个AI系统,让多个AI系统辩论问题的答案可以显著提高响应的准确性和推理能力。这一研究成果出现在题为《通过多智能体辩论提高语言模型的真实性和推理能力》的论文中。该研究还得到了Google DeepMind研究员Igor Mordatch的合作。
研究人员将这一方法命名为“多智能体社会(Multiagent Society)”,并发现它可以减少生成输出中的幻觉。最令人兴奋的是,这一方法甚至可以应用于像OpenAI的ChatGPT这样的现有黑盒模型。
这一方法的实施包括多轮回的响应生成和评论。模型首先生成对给定问题的答案,然后整合来自其他智能体的反馈,以更新自己的响应。研究人员发现,这一过程可以改善最终的输出,因为它类似于团队讨论的结果,各个智能体共同贡献答案以达成统一的结论。
此外,这一方法还可以用于结合不同的语言模型,比如将ChatGPT与Google Bard进行对比。虽然这两个模型在示例提示下都生成了不正确的答案,但它们之间可以生成正确的最终答案。
通过多智能体社会方法,MIT团队能够在自然语言处理、数学和解谜等各种基准测试中取得卓越的成绩。例如,在流行的MMLU基准测试中,使用多个智能体的模型准确度得分为71,而仅使用单个智能体的得分为64。
主要研究人员之一,MIT博士生Yilun Du表示:“我们的方法使用了多个AI模型,每个模型都带来了独特的见解来解决问题。尽管它们的初始响应可能会显得缩短或包含错误,但这些模型可以通过审查其同行提供的响应来提炼和改进自己的答案。”
这一研究成果为AI领域的进一步发展提供了新的思路和方法,有望改进现有的语言模型,并提高其真实性和推理能力。
一大批男性用户涌入小红书
小红书男性用户增速超过大盘在大众印象中,小红书常常与美妆、时尚、生活方式等女性主导的领域紧密相连,其细腻的生活分享与消费指南功能深受女性用户喜爱。然而,近年来,一个不容忽视的现象悄然发生:小红书的男性用户群体正以超过大盘的速度迅速增长。站长网2024-07-09 17:21:020002谷歌强化 Android 应用监管规定,要求严格审查人工智能生成内容
要点:1.谷歌要求Android应用程序改进对人工智能生成内容的内容审查,要求应用程序提供举报冒犯内容的途径。2.Android应用程序使用人工智能生成的内容将需要在明年初前添加一个举报冒犯材料的按钮,以继续留在谷歌的Play商店。站长网2023-10-26 09:48:190000FromSoftware社宣布全体员工涨薪11.8%:应届生起薪调至14370元人民币
快科技10月4日消息,FromSoftware宣布,从2025年4月起,注册员工的平均基本工资将增长约11.8%。应届毕业生的起薪也将从26万日元(约合12,456人民币)提高到30万日元(约合14,370人民币)。0000百度申请Comate智能编码助手商标
天眼查App显示,6月12日,百度在线网络技术(北京)有限公司申请多个“Comate智能编码助手”商标,国际分类涉及科学仪器、通讯服务、网站服务,当前商标状态均为申请中。此前,百度智能云推出“Comate”代码助手,并正式开放邀测。借助文心大模型的理解、推理能力,“Comate”可实现代码的快速补齐、自然语言推荐代码、自动查找代码错误,全面提升开发者研发效率。站长网2023-06-26 23:41:340001美图旗下WHEE上线AI改图功能 涂抹即可局部重绘
近日,美图公司旗下AI视觉创作工具WHEE推出了AI改图功能,这项功能大幅降低了专业图像编辑的门槛,使普通用户也能享受到AI创作的乐趣。用户只需涂抹想要修改的画面区域并输入文字补齐,就能完成图像修改,使局部重绘变得更加简单。传统的图像局部重绘需要美术功底和专业工具操作技能,对普通用户来说门槛很高,而AI改图功能的推出使得普通用户也能轻松完成高难度的局部重绘效果。站长网2024-03-11 09:02:450000