谷歌推出ASPIRE框架 让大模型具备自我判断意识
站长网2024-02-07 09:40:450阅
谷歌最近推出了一项名为ASPIRE的自适应评估框架,旨在帮助大型语言模型在面对置信度较低的样本时做出正确的判断。这个框架的核心技术思路是基于自我评估的选择性预测,通过任务定向微调、答案采样和自我评估学习三大模块来实现。

论文地址:https://aclanthology.org/2023.findings-emnlp.345.pdf?ref=maginative.com
具体来说,任务定向微调能够通过使用目标任务的训练数据对模型进行微调,提高其在特定任务上的性能。答案采样则可以生成多个候选答案,并评估其概率分布,以帮助模型判断答案的可靠性。自我评估学习则通过学习自我评估能力,让模型能够更好地区分正确和错误答案,从而提高选择性预测性能。
实验数据显示,ASPIRE在不同数据集上均表现出了良好的性能。例如,在CoQA数据集上,ASPIRE框架将答案的准确性提升了,并且能够减少错误答案的生成;在TriviaQA数据集上,通过设置选择性分数阈值,ASPIRE能够更准确地判断出哪些问题的答案不可靠,从而避免生成错误答案;在Natural Questions数据集上,ASPIRE成功降低了错误答案的比例,提高了答案的质量。这些实验证明了ASPIRE框架的高效性和可行性,为大型语言模型的应用提供了重要的支持和保障。
ASPIRE框架的推出填补了大型语言模型在置信度校准方面的空白,为其在实际应用中的稳定性和准确性提供了有力保障。随着这一框架的不断完善和应用,相信大型语言模型在各个领域的表现将会更加出色,为人们带来更好的体验和服务。
0000
评论列表
共(0)条相关推荐
麻省理工学院研究:辩论让AI机器人更加聪明
文章概要:1.MIT研究发现,多智能体辩论可以提高AI模型的准确性和推理能力。2.辩论方法减少了幻觉,帮助模型增强响应能力。3.研究团队发现,让多个AI系统辩论问题的答案比仅使用单个AI系统可以提高响应的准确性。站长网2023-09-21 11:01:280000东京大学研究人员:通过识别面部特征 AI可充当测谎仪
日本东京大学的研究人员提出了一种结合面部表情和脉搏率数据的机器学习方法,用于自动识别欺骗行为。他们的目标是开发一个公正可靠的系统,可以在与犯罪受害者、嫌疑人和心理健康问题个体的讯问中提供帮助。研究人员强调准确的嫌疑人分类的重要性,以避免误认和维护道德和法律考虑;他们建议采用人机结合的方法。这种创新方法既确保了道德合规性,又可以在重要的决策过程中广泛应用。站长网2023-08-03 10:21:040005全球三折叠屏手机 拼多多上架华为Mate XT非凡大师
快科技9月22日消息,日前,全球首款三折叠屏手机华为MateXT非凡大师正式开售,售价19999元起。目前,拼多多已上架华为MateXT非凡大师,开售时间与华为官网一致。页面显示,为保障消费者购买需求及公平交易机会,避免因非生活消费目的购买或者囤积商品、抬价转售等不当行为发生,华为MateXT非凡大师下单后暂不支持修改地址,并且发货后无法转寄。站长网2024-09-23 21:27:530000智源开源中英文语义向量模型BGE 支持免费商用
近日,智源发布最强开源可商用中英文语义向量模型BGE(BAAIGeneralEmbedding),在中英文语义检索精度与整体语义表征能力均超越了社区所有同类模型,如OpenAI的textembedding002等。此外,BGE保持了同等参数量级模型中的最小向量维度,使用成本更低。站长网2023-08-07 16:12:130000如何正确使用FSD:特斯拉官方终于发说明了
快科技2月28日消息,FSD辅助驾驶进入中国已有数日,今日特斯拉官方终于发布了明确的使用说明,包括如何开启、如何退出以及重要提示。如何开启:进入车辆后,点击控制,选择Autopilot智能辅助驾驶,选择启用FSD智能辅助驾驶,仔细阅读此处弹出的智能辅助转向功能介绍,确认无误后,点击是开启智能辅助转向功能。站长网2025-03-03 07:28:010000