UCLA推出Chameleon框架 大模型表格数学推理准确率达98.78%
要点:
UCLA推出Chameleon框架,通过多工具融合,包括LLMs、视觉模型、搜索引擎等,解决大型语言模型在实时信息获取和精确数学推理上的不足,在表格数学推理任务上达到98.78%准确率。
Chameleon框架核心在于LLM规划器生成自然语言程序,通过灵活组合多工具,如科学问答任务中以86.54%准确率超越现有模型,在表格数学推理任务中更是达到惊人的98.78%准确率。
Chameleon模型的灵感来源于变色龙,象征着大型语言模型在执行外部工具组合推理任务时的多功能性和适应性,引起广泛关注并获得学术认可。
在NeurIPS2023上,UCLA等机构发布的Chameleon框架吸引了广泛关注。该框架通过融合多种工具,包括LLMs、视觉模型、搜索引擎、Python功能及基于规则的模块,解决了大型语言模型在实时信息获取和数学推理方面的不足。
Chameleon的核心在于通过LLM规划器生成自然语言程序,找到最佳工具组合,以达到精确推理的目的。该框架在科学问答任务和表格数学推理任务上表现卓越,特别是在表格数学推理任务上,准确率达到了惊人的98.78%。
项目地址:https://chameleon-llm.github.io/
Chameleon的灵感来源于变色龙,象征着大型语言模型在执行外部工具组合推理任务时的多功能性和适应性。与其他工作相比,Chameleon在工具多样性和调用灵活性方面具有显著优势。
其工具箱支持LLM模型、视觉模型、网络搜索引擎、Python函数以及基于规则的模块,实现了多种工具之间的自然语言通信。相较于现有工作,Chameleon模型允许以类似自然语言的方式生成不同工具的调用组合,无需复杂的程序设计,增加了用户友好性。
Chameleon模型由工具箱和LLM规划器构成,工具箱包含各种技能的工具,如图像理解、知识理解、数学推理、表格推理和问答。LLM规划器基于大型语言模型,通过提示学习和语境学习能力,生成自然语言形式的程序,从而实现对工具箱中的工具进行组合和调用。Chameleon模型的评测表现在多模态推理任务上进行,如科学问答和表格数学推理,取得了令人瞩目的成绩。
Chameleon框架在多工具融合、自然语言程序生成和多模态推理任务上展现出卓越的性能,为大型语言模型在复杂任务中的应用提供了新的思路和解决方案。其灵活性、适应性和用户友好性使其在学术界和开发者社区中受到瞩目。
一张“纸片”卖4万,这门暴利生意,崩了?
近几年,一种“小纸片”在追星族中流行,其中稀缺款甚至可卖出数万元一张的高价,圈内人一般将其称之为“小卡”。所谓“小卡”,原本是韩国娱乐公司在推出专辑时随专附赠的印有艺人照片的卡片,一般约为3寸照片大小、硬卡质地,本质上是一种音乐专辑周边。0000外卖柜收费一年观察:从被质疑到被理解
自2022年8月,某平台率先试行“外卖柜收费”政策以来,其余主流平台也纷纷跟进,有关“外卖柜该不该收费”相关话题讨论便备受关注。如今,外卖柜试行收费已满一年之际,全国多地将面向骑手收取服务费的消息再度牵动大众神经。不过派代注意到,与最初大家普遍持质疑态度不同的是,各界对于“外卖柜收费”现象有了更多元的理解,并发出了不同的声音。外卖柜,解决最后100米园区、楼宇不让进入的最优方案站长网2023-10-20 13:51:440000iPhone应用侧载即将到来 苹果拟建立管控机制确保用户安全
据wccftech报道,苹果公司有可能在2024年上半年实现iPhone应用程序侧载。所谓应用侧载,是指用户可以不经过AppStore,直接从第三方获取应用程序。这一举措将突破苹果长期坚持的封闭策略。站长网2023-11-14 10:11:020000一段乱码,竟让ChatGPT越狱!乱序prompt让LLM火速生成勒索软件,Jim Fan惊了
【新智元导读】外国网友发现全新越狱技术——只要告诉ChatGPT它可以认识乱序排列的单词,就可以通过输入乱序的prompt,让它生成勒索软件了。继奶奶漏洞之后,ChatGPT又有新「玩法」了!这位国外的网友说,自己刚刚发现了一种全新的越狱技术,让ChatGPT创建勒索软件、键盘记录器等。我们都知道,人脑可以读懂顺序打乱的字句和单词,并不影响理解。而这位网友正是利用了这一点。站长网2023-08-19 15:27:430000All in AI!魅族公布三大战略:打造AI终端、重构Flyme、建设AI生态
快科技2月29日消息,今日晚间,魅族科技在珠海长琴岛举办魅族特别活动,除了将发布魅族首款AI终端魅族21PRO外,还公布了AllinAI战略。据了解,魅族将从三个方面展开AllinAI的战略,魅族将打造全新的AIDevice,通过产品形态AI原生设计、硬件算力AI全局调用等,为用户带来更加智能、便捷、创新的AI产品体验。站长网2024-02-29 20:19:060000