新视角! 研究发现:大语言模型通过阅读文档学会使用工具
站长网2023-08-07 11:38:390阅
本文概要:
1. 研究发现,语言模型通过阅读文档成功学会使用工具,甚至能够发明新的方法。
2. 使用文档训练的模型在零样本性能上与仅使用演示训练的模型相当甚至更好。
3. 通过阅读文档,语言模型可以学习复杂的图像处理和视频跟踪功能。
根据一篇新的研究论文,语言模型可以通过阅读工具和API文档来学习使用工具,并在某些情况下甚至发明新的方法。与传统的通过演示训练的方法相比,仅使用文档的模型在零样本性能上表现相当或更好。
该团队使用文档和演示对六种不同任务的多个模型进行了训练,并比较了它们的性能。仅使用文档,零样本性能等于或优于仅从演示中学习的模型。然后,在扩展到包含200个工具的数据集后,第一个模型的性能显着优于第二个模型。
在图像处理领域,该模型能够通过学习新的、最先进的图像处理模块的文档来执行复杂的图像处理和视频跟踪功能,而无需进一步演示。该团队特别强调,该模型能够重现最近发布的图像处理技术,例如 Grounded-SAM 和 Track Anything 的视频跟踪,展示了该方法在自动知识发现方面的潜力。
论文指出:“总的来说,我们通过关注LLM的内部规划和文档推理能力,而不是通过演示明确指导他们的行为,揭示了LLM使用工具的新视角。”
这项研究揭示了阅读文档对于语言模型学习工具使用的重要性,以及文档对于扩展和自动知识发现的潜力。
0000
评论列表
共(0)条相关推荐
小扎亲自官宣!Meta发布视觉大模型DINOv2 可自我监督
Meta发布了DINOv2,这是一种最先进的计算机视觉自监督模型,可以在深度估计、语义分割和图像相似性比较等任务中实现SOTA级别的性能。该模型可以借助卫星图像生成不同大洲的森林高度,在医学成像和作物产量估算等领域具有潜在应用。DINOv2代表了计算机视觉自监督学习的重大突破,这可能会在未来产生更准确、更高效的模型。它还在包括农业和医疗保健在内的各个行业都有潜在的应用。站长网2023-04-19 09:51:330001凌晨直播的老年人,卖惨也卖货
“谢谢大家下单”“希望你们喜欢我的产品”凌晨1点,连话都说不清的的老人还在直播间反复说着:“谢谢”。据老爷爷描述,老伴和儿媳都患有精神疾病,儿子一个人要照顾他们三个人,非常不容易,只好让他出来直播增添家用。这样的家庭背景引起了很多网友的同情,不少用户主动在直播间热心刷礼物、购买产品。站长网2023-08-17 09:11:320001比 ChatGPT 大 5 倍!英特尔官宣 1 万亿参数 AI 大模型,计划 2024 年完成
眼看着ChatGPT持续爆火了几个月,期间微软、谷歌、Meta等科技巨头接连入局,如今英特尔也终于官宣“参赛”。站长网2023-05-25 14:34:130002掌趣科技:与行者AI达成战略合作 加强游戏AIGC领域生态布局
掌趣科技官方宣布,公司与行者AI达成战略合作,共同致力于推进AIGC技术在游戏产业的创新应用。据介绍,此次合作将进一步加强掌趣科技在游戏AIGC领域的生态布局,扩大技术及创新工具的储备,加速掌趣科技“AI游戏创作平台”的研发,全面践行“AIUGC”的战略部署。站长网2023-07-17 01:19:150000腾讯音乐发布2023年第三季度财报:营收65.7亿元 同比下滑10.8%
腾讯音乐发布了2023年第三季度财报,数据显示,该季度总营收为65.7亿元,同比下滑10.8%。净利润为12.6亿元,同比增长15.6%。站长网2023-11-14 17:48:390000