UCLA推出Chameleon框架 大模型表格数学推理准确率达98.78%
要点:
UCLA推出Chameleon框架,通过多工具融合,包括LLMs、视觉模型、搜索引擎等,解决大型语言模型在实时信息获取和精确数学推理上的不足,在表格数学推理任务上达到98.78%准确率。
Chameleon框架核心在于LLM规划器生成自然语言程序,通过灵活组合多工具,如科学问答任务中以86.54%准确率超越现有模型,在表格数学推理任务中更是达到惊人的98.78%准确率。
Chameleon模型的灵感来源于变色龙,象征着大型语言模型在执行外部工具组合推理任务时的多功能性和适应性,引起广泛关注并获得学术认可。
在NeurIPS2023上,UCLA等机构发布的Chameleon框架吸引了广泛关注。该框架通过融合多种工具,包括LLMs、视觉模型、搜索引擎、Python功能及基于规则的模块,解决了大型语言模型在实时信息获取和数学推理方面的不足。
Chameleon的核心在于通过LLM规划器生成自然语言程序,找到最佳工具组合,以达到精确推理的目的。该框架在科学问答任务和表格数学推理任务上表现卓越,特别是在表格数学推理任务上,准确率达到了惊人的98.78%。

项目地址:https://chameleon-llm.github.io/
Chameleon的灵感来源于变色龙,象征着大型语言模型在执行外部工具组合推理任务时的多功能性和适应性。与其他工作相比,Chameleon在工具多样性和调用灵活性方面具有显著优势。
其工具箱支持LLM模型、视觉模型、网络搜索引擎、Python函数以及基于规则的模块,实现了多种工具之间的自然语言通信。相较于现有工作,Chameleon模型允许以类似自然语言的方式生成不同工具的调用组合,无需复杂的程序设计,增加了用户友好性。
Chameleon模型由工具箱和LLM规划器构成,工具箱包含各种技能的工具,如图像理解、知识理解、数学推理、表格推理和问答。LLM规划器基于大型语言模型,通过提示学习和语境学习能力,生成自然语言形式的程序,从而实现对工具箱中的工具进行组合和调用。Chameleon模型的评测表现在多模态推理任务上进行,如科学问答和表格数学推理,取得了令人瞩目的成绩。
Chameleon框架在多工具融合、自然语言程序生成和多模态推理任务上展现出卓越的性能,为大型语言模型在复杂任务中的应用提供了新的思路和解决方案。其灵活性、适应性和用户友好性使其在学术界和开发者社区中受到瞩目。
折扣店的“羊毛”,年轻人快薅不动了
田雨最近逛“嗨特购”有些郁闷,她购买了一盒面膜和两瓶橙汁,但在结账时发现多了4元,原因是店内区分为会原价和非会员价,如果办一张99元会员卡,她可以享受到更低的会员价格。对此,她感到很不理解,“我来折扣店就是为了薅羊毛,为什么要花钱办会员才能更好地享受低价的快乐?”站长网2023-06-18 17:18:530000在 Ilya Sutskever 宣布 Sam Altman 不会回归后,数十名员工离职 OpenAI
站长之家(ChinaZ.com)11月20日消息:据TheInformation消息,了解情况的人士称,数十名OpenAI员工在当地周日晚间宣布将离职公司,此举发生在董事会成员兼首席科学家IlyaSutskever告知员工被解雇的首席执行官SamAltman不会返回公司后。站长网2023-11-20 16:01:150000我,用AI帮1000名准妈妈预测婴儿长相,每单卖9.9元
ChatGPT(生成式对话机器人)公测已有8个月,数的上号的国内外科技公司无一例外地在这期间推出了自己的AI大模型。但热闹的另一面,是这些AI大模型的商业化,至今仍处在探索阶段。相较于大公司探索大业务,中国小商家总是能机敏地在技术迭代的过程中,找到做小生意的空间。比如我们曾经观察过的,那些“注册200个账号,卖5万一套的系统,靠ChatGPT赚钱的人”。站长网2023-07-21 16:46:460000iPhone 15系列一分钟被抢光 价格破发
苹果最新机型iPhone15系列于9月15日晚间正式开启预购,尽管iPhone的影响力依然强大,但不少消费者在第一时间下单后,9月16日却出现了一些令人意想不到的情况。有网友注意到,“今年的iPhone15没往年那么难抢”和“首批iPhone15Pro一分钟被抢光”同时登上热搜。站长网2023-09-17 09:11:520000“浪姐4”美依礼芽爆火出圈后:吸粉超430万,“抖快红”争相出手
“去年还是王心凌男孩,今年就是美依礼芽的二次元老肥宅。”近日,随着芒果TV《乘风2023》节目的火爆,谁是继王心凌后的第二个“涨粉奇迹”被大众广泛讨论。然而,可能就连芒果台自己也没想到,在汇集了谢娜、陈嘉桦Ella、蔡少芬等一众大咖阵容中,今年节目中人气断层的选手,居然会是来自日本的二次元歌手美依礼芽。站长网2023-05-22 11:57:230004