DeepMind将GPT-4变成工具制造者 推出LATM框架
站长网2023-05-31 10:50:450阅
Google DeepMind、普林斯顿大学和斯坦福大学的研究人员提出了一款LATM框架,可以将GPT-4等大型语言模型变为工具制造者(LATM,即LLMs As Tool Makers),能够生成自己的可重新使用的工具来处理新任务。
这个框架包括两个关键阶段:
工具制造:LLM作为工具制造者,专门为给定的任务设计工具(以Python函数形式实现)。
工具使用:另一个LLM作为工具使用者,可以调用工具来处理新的请求。
这种两阶段的设计允许LATM将任务分配给最合适的LLM。一方面,需要高强度能力的工具制造过程可以分配给功能强大、资源密集型的模型(例如GPT-4)。另一方面,相对简单的使用工具过程可以分配给轻量级、经济高效的模型(例如GPT-3.5Turbo)。这种方法不仅增强了LLM解决问题的能力,而且可以显著降低处理一系列任务的平均计算成本。
实验结果验证了这种方法在复杂推理任务上的有效性。结果表明,LATM可以达到与资源密集型模型相当的性能,同时具有更高的成本效益。这种新型大型语言模型方法仿照了人类创造和使用工具的进化之飞跃,为开辟使用大型语言模型生成的工具的社区提供了无限的可能性。
论文地址:
https://arxiv.org/pdf/2305.17126.pdf
0000
评论列表
共(0)条相关推荐
CoDA开源:可在3D场景中检测和命名新物体
CoDA是一个端到端的开放词汇3D目标检测框架,旨在同时实现新对象的定位和分类。它主要包括两大特点:1.3D新对象发现策略:利用3D几何先验和2D语义先验联合发现场景中的新对象,生成新对象的伪标签。2.基于发现的跨模态对齐:将3D点云特征与图像/文本特征对齐,利用已有类别和不断发现的新对象类别进行对齐,使对齐迭代增强。站长网2023-10-08 11:53:330000Zoom 表示其生成式 AI 工具不会未经用户同意采用其数据进行训练
Zoom在周一更新了其服务条款,此前由于该公司关于以用户数据训练人工智能的政策引发了争议。尽管政策字面上说Zoom保留在未经您明确许可的情况下对您的通话进行人工智能训练的权利,但现在的服务条款中新增了一行内容,基本上是说,我们承诺不会这样做。站长网2023-08-08 09:00:460000淘宝夏日清凉版今晚8点上线 将发放1000万份免费高温补贴
据悉,今晚8点淘宝将上线夏日清凉版,上新夏日限定logo和清凉皮肤,发放1000万份免费的高温补贴。上淘宝搜索“太热了”还有一个透心凉的彩蛋此外,首场促销“狂暑季”也将在今晚8点开卖,各式降温神器官方立减10%起,手机和大家电等以旧换新至高补贴1500元。站长网2023-07-13 06:58:230000字节跳动回应百万美元挖角 OpenAI 团队成员:消息不实
近日,有传闻称字节跳动准备挖角OpenAI团队的成员,并开出140万美元的年薪。不过,4月24日,字节跳动相关负责人回应澎湃新闻称这一消息不实。站长网2023-04-25 09:16:070000法拉第未来:董事会并未考虑任命贾跃亭为联席 CEO
近日,法拉第未来在其官方声明中明确指出,公司董事会目前并未考虑任命贾跃亭为公司联席CEO的提议。这一声明与贾跃亭此前发布的个人视频声明形成了鲜明对比。站长网2024-05-07 19:48:520000