UCLA推出Chameleon框架 大模型表格数学推理准确率达98.78%
要点:
UCLA推出Chameleon框架,通过多工具融合,包括LLMs、视觉模型、搜索引擎等,解决大型语言模型在实时信息获取和精确数学推理上的不足,在表格数学推理任务上达到98.78%准确率。
Chameleon框架核心在于LLM规划器生成自然语言程序,通过灵活组合多工具,如科学问答任务中以86.54%准确率超越现有模型,在表格数学推理任务中更是达到惊人的98.78%准确率。
Chameleon模型的灵感来源于变色龙,象征着大型语言模型在执行外部工具组合推理任务时的多功能性和适应性,引起广泛关注并获得学术认可。
在NeurIPS2023上,UCLA等机构发布的Chameleon框架吸引了广泛关注。该框架通过融合多种工具,包括LLMs、视觉模型、搜索引擎、Python功能及基于规则的模块,解决了大型语言模型在实时信息获取和数学推理方面的不足。
Chameleon的核心在于通过LLM规划器生成自然语言程序,找到最佳工具组合,以达到精确推理的目的。该框架在科学问答任务和表格数学推理任务上表现卓越,特别是在表格数学推理任务上,准确率达到了惊人的98.78%。
项目地址:https://chameleon-llm.github.io/
Chameleon的灵感来源于变色龙,象征着大型语言模型在执行外部工具组合推理任务时的多功能性和适应性。与其他工作相比,Chameleon在工具多样性和调用灵活性方面具有显著优势。
其工具箱支持LLM模型、视觉模型、网络搜索引擎、Python函数以及基于规则的模块,实现了多种工具之间的自然语言通信。相较于现有工作,Chameleon模型允许以类似自然语言的方式生成不同工具的调用组合,无需复杂的程序设计,增加了用户友好性。
Chameleon模型由工具箱和LLM规划器构成,工具箱包含各种技能的工具,如图像理解、知识理解、数学推理、表格推理和问答。LLM规划器基于大型语言模型,通过提示学习和语境学习能力,生成自然语言形式的程序,从而实现对工具箱中的工具进行组合和调用。Chameleon模型的评测表现在多模态推理任务上进行,如科学问答和表格数学推理,取得了令人瞩目的成绩。
Chameleon框架在多工具融合、自然语言程序生成和多模态推理任务上展现出卓越的性能,为大型语言模型在复杂任务中的应用提供了新的思路和解决方案。其灵活性、适应性和用户友好性使其在学术界和开发者社区中受到瞩目。
五家大厂瓜分春节流量:谁赔本?谁赢了?
春节历来是互联网公司的超级战场,2024年龙年春节的过节氛围里,已经透出了互联网大厂的火药味。如果把镜头拉高拉远,我们可以看到剑拔弩张的两大战场:第一个战场,也是龙年春节最大战场——春晚。这一届,砸钱派的代表是京东和小红书。站长网2024-01-31 09:02:460000除夕放假,大厂这次想明白了
2023年10月25日,国务院办公厅发布了2024年春节假日安排,今年的春节假期有足足8天,但是假期是从农历正月初一到初八,除夕当天并不放假。消息公布后,关于“今年除夕不放假”引发热议。官方给出的解释是,鼓励各单位结合带薪休假等制度落实,安排职工在除夕休息。0000英伟达加速人工智能初创公司投资 接近与云服务公司 Lambda Labs 达成股权交易
英伟达以其对为ChatGPT和其他人工智能软件提供支持的数据中心芯片市场的垄断而闻名。但在短短几个月内,英伟达也成为了需要其芯片的一类重要客户的最大风险资本投资者:云和人工智能软件初创公司。站长网2023-07-19 19:53:480000生成式语音AI工具Resemble AI 支持50多种语言
ResembleAI是一款可以生成人类声音的人工智能工具。它可以从你提供的语音数据中克隆声音,只需要5分钟的数据就可以开始。它提供文本到语音、语音到语音、神经音频编辑、语言配音、情感、实时语音克隆、本地化和类似填充功能。体验地址:https://www.resemble.ai/站长网2023-08-16 14:33:020000马斯克将砍掉X(推特)“拉黑”功能:负面反馈是一件好事
科技巨头马斯克最近在推特上发表了一条推文,宣布未来将取消屏蔽某人的功能,并认为这一功能毫无意义。据了解,推特目前提供了隐藏和屏蔽两个选项。隐藏功能包括隐藏特定账号的推文以及隐藏整个对话,这意味着用户将不再看到该账号的相关内容。而屏蔽功能则能阻止其他人查看用户的推文、关注用户以及与用户互动。这一功能与国内社交应用的“拉黑”功能相似,它能防止被拉黑的人查看自己的内容,让用户更加掌握主动权。站长网2023-08-21 09:23:150000