新视角! 研究发现:大语言模型通过阅读文档学会使用工具
站长网2023-08-07 11:38:390阅
本文概要:
1. 研究发现,语言模型通过阅读文档成功学会使用工具,甚至能够发明新的方法。
2. 使用文档训练的模型在零样本性能上与仅使用演示训练的模型相当甚至更好。
3. 通过阅读文档,语言模型可以学习复杂的图像处理和视频跟踪功能。
根据一篇新的研究论文,语言模型可以通过阅读工具和API文档来学习使用工具,并在某些情况下甚至发明新的方法。与传统的通过演示训练的方法相比,仅使用文档的模型在零样本性能上表现相当或更好。
该团队使用文档和演示对六种不同任务的多个模型进行了训练,并比较了它们的性能。仅使用文档,零样本性能等于或优于仅从演示中学习的模型。然后,在扩展到包含200个工具的数据集后,第一个模型的性能显着优于第二个模型。
在图像处理领域,该模型能够通过学习新的、最先进的图像处理模块的文档来执行复杂的图像处理和视频跟踪功能,而无需进一步演示。该团队特别强调,该模型能够重现最近发布的图像处理技术,例如 Grounded-SAM 和 Track Anything 的视频跟踪,展示了该方法在自动知识发现方面的潜力。

论文指出:“总的来说,我们通过关注LLM的内部规划和文档推理能力,而不是通过演示明确指导他们的行为,揭示了LLM使用工具的新视角。”
这项研究揭示了阅读文档对于语言模型学习工具使用的重要性,以及文档对于扩展和自动知识发现的潜力。
0000
评论列表
共(0)条相关推荐
亚马逊发布其有史以来最大的文本转语音模型 BASE TTS
划重点:⭐️亚马逊AGI团队发布了有史以来最大的文本转语音模型,具有最多的参数和最大的训练数据集。⭐️新模型名为BASETTS,拥有980亿参数,使用了10万小时的录音数据进行训练,主要是英语。⭐️该团队计划将BASETTS用作学习应用,以改进文本转语音应用的人类声音质量。站长网2024-02-18 10:04:480000马斯克支持的脑机接口公司 Neuralink 融资 2.8 亿美元
埃隆·马斯克(ElonMusk)支持的生物技术公司Neuralink周一在一条简短的推文中宣布筹集2.8亿美元的D轮资金,由PeterThiel的创始人基金领投。站长网2023-08-08 10:21:500000最高可罚3万背后:谁来为送货上门买单?
他知道哪家客户的脾气像炸弹,会同情哪家遭遇了不幸,也记得住友善客户的名字。那座小区的物业出于安全考虑,不许快递员进。刚入行的亮子曾在门口和客户在电话里吵起来,客户要求他必须送货上门:“管你什么办法,必须送上门,我家都是老人,没人能去门口拿。”门口保安指了指摄像头,说没办法通融。最后亮子在电话里骂脏话,被客户投诉到公司,丢了工作。站长网2024-03-04 19:15:260000作者指控 Meta 不顾自己律师的警告,将受版权保护的书籍用于人工智能训练
Meta在一起夏季提起的版权侵权诉讼中的最新提交文件显示,尽管律师警告使用数千本盗版书籍训练其AI模型的法律风险,该公司仍然这样做了。0000谷歌AI搜索出现问题,竟推广欺诈网站和恶意软件
划重点:🔍谷歌新的AI搜索功能已经推出,但已经出现了一些问题,据报道,该功能可能会在搜索结果中推广一些欺诈网站和恶意软件。🔍一些用户报告称,在搜索过程中遇到了AI生成的响应,这些响应指向一些垃圾网站,可能会存在恶意软件。🔍虽然谷歌声称正在解决这个问题,但这一事件突显了该技术巨头在处理垃圾和恶意软件网站方面的持续挣扎。站长网2024-03-26 11:29:460000