谷歌 DeepMind 研究人员推出 Promptbreeder:一种自我推理、自我完善的人工智能系统,可在给定领域内自动生成有效的特定领域提示语
站长之家(ChinaZ.com) 10月9日消息:大型语言模型(LLMs)因其模仿人类特性而引起了广泛关注。这些模型能够回答问题、生成内容、总结长文本段落等等。提示语对于提高 LLMs(如 GPT-3.5 和 GPT-4)的性能至关重要。
提示语的创建方式可以对 LLMs 在各种领域的能力产生重大影响,包括推理、多模态处理、工具使用等等。研究人员设计的这些技术在模型蒸馏和代理行为模拟等任务中显示出了潜力。
提示方法的手动工程引发了一个问题,即是否可以自动化这个过程。通过根据来自数据集的输入-输出实例生成一组提示语,自动提示工程师(APE)试图解决这个问题,但从提示语质量的角度来看,APE 存在着递减的回报。研究人员提出了一种基于维持多样性的进化算法的方法,用于自我参考的提示语的自我改进,以克服提示语创建中的递减回报问题。
LLMs 可以改变其提示语以提高其能力,就像神经网络可以改变其权重矩阵以提高性能一样。根据这种比较,LLMs 可以被创建来增强它们自己的能力以及它们增强自己能力的过程,从而使人工智能能够不断改进。作为对这些想法的回应,Google DeepMind 的研究团队最近引入了 PromptBreeder(PB),这是一种 LLMs 以自我参考的方式更好地提升自己的技术。
PB 需要一个特定领域的问题描述、一组初始突变提示语(用于修改任务提示语的指令)以及思维风格,即以文本形式表示的通用认知启发式。通过利用 LLM 作为突变操作符的能力,它生成不同的任务提示语和突变提示语。这些进化的任务提示语在训练集上进行评估,选择包含任务提示语及其相关突变提示语的进化单元的子集,用于未来的世代。
该团队表示,PromptBreeder 观察到提示会在几代中适应特定领域。例如,PB 开发了一个任务提示,其中明确说明了如何解决数学领域的数学问题。在各种基准任务中,包括常识推理、算术和伦理学,PB 都优于最先进的提示技术。PB 不需要更新参数来进行自我参照的自我改进,这表明未来更广泛、更有能力的 LLMs 可能会从这一策略中受益。
PromptBreeder 的工作流程可以总结如下:
1. 任务提示语突变:任务提示语是为特定任务或领域创建的提示语。PromptBreeder 从这些提示语开始。然后对任务提示语进行突变,生成变体。
2. 适应性评估:使用训练数据集,评估这些修改后的任务提示语的适应性。这个评估衡量了 LLM 在被问及时如何应对这些变化。
3. 持续进化:与生物进化类似,突变和评估的过程会重复几代。
总而言之,PromptBreeder 被认为是一种独特且成功的技术,用于自主演化 LLMs 的提示语。它试图提高 LLMs 在各种任务和领域中的性能,最终通过不断改进任务提示语和突变提示语,优于手动示方法。
查看 PromptBreeder(PB)论文:
https://arxiv.org/abs/2309.16797
AMD 的 AI 芯片转单给三星可能性不大 与台积电已合作至 2nm 制程
站长之家(ChinaZ.com)7月18日消息:据DIGITIMES消息,英伟达AIGPU出货逐季飙升,接下来AMDMI300系列将在第4季底量产。站长网2023-07-18 17:22:550000Sora团队深入解读视频生成模型 短期内不向公众开放
知名科技博主MKBHD日前专访了备受瞩目的Sora视频生成模型开发团队,就Sora的工作原理、当前发展状况及未来规划等进行了深入探讨。据了解,Sora由前OpenAI研究员BillPeebles、TimBrooks和DALL·E开发者AdityaRamesh组成。团队介绍,Sora是一款通过学习大量视频数据而能够生成逼真视频的AI模型,其灵活性和适应性都十分出色。站长网2024-03-13 15:17:530000GPT-4不知道自己错了! LLM新缺陷曝光,自我纠正成功率仅1%,LeCun马库斯惊呼越改越错
【新智元导读】GPT-4根本不知道自己犯错?最新研究发现,LLM在推理任务中,自我纠正后根本无法挽救性能变差,引AI大佬LeCun马库斯围观。大模型又被爆出重大缺陷,引得LeCun和马库斯两位大佬同时转发关注!在推理实验中,声称可以提高准确性的模型自我纠正,把正确率从16%「提高」到了1%!站长网2023-10-22 15:49:580001腾讯游戏发布2023暑期限玩日历
为了让广大未成年玩家们更好地安排时间,腾讯游戏发布“2023暑期限玩日历”称,结合《关于进一步严格管理切实防止未成年人沉迷网络游戏的通知》,2023年暑假期间(由于各地放假时间有差异,此处的“暑假期间”指2023年7月1日-8月31日),腾讯游戏旗下在中国大陆地区运营的网络游戏面向未成年人的游戏限玩执行如下:站长网2023-06-29 19:07:270001中消协点名共享充电宝好借难还:企业应提高消费纠纷解决效率
今日,中消协发布了2023年上半年消费维权舆情热点,2023年上半年,有关线下演出“退票难”、酒店民宿毁约侵权纠纷、知名餐饮品牌食品安全问题隐患、视频平台会员服务体验不佳、研学游侵权“陷阱”、家乐福商超购物卡限制消费、航空里程积分清零、共享充电宝“好借难还”、网红竹筒奶茶被曝食品安全问题、低价旅游团强制购物问题等多个案例涉及的消费维权问题较为突出。站长网2023-08-04 11:27:090000