谷歌推出ASPIRE框架 让大模型具备自我判断意识
站长网2024-02-07 09:40:450阅
谷歌最近推出了一项名为ASPIRE的自适应评估框架,旨在帮助大型语言模型在面对置信度较低的样本时做出正确的判断。这个框架的核心技术思路是基于自我评估的选择性预测,通过任务定向微调、答案采样和自我评估学习三大模块来实现。
论文地址:https://aclanthology.org/2023.findings-emnlp.345.pdf?ref=maginative.com
具体来说,任务定向微调能够通过使用目标任务的训练数据对模型进行微调,提高其在特定任务上的性能。答案采样则可以生成多个候选答案,并评估其概率分布,以帮助模型判断答案的可靠性。自我评估学习则通过学习自我评估能力,让模型能够更好地区分正确和错误答案,从而提高选择性预测性能。
实验数据显示,ASPIRE在不同数据集上均表现出了良好的性能。例如,在CoQA数据集上,ASPIRE框架将答案的准确性提升了,并且能够减少错误答案的生成;在TriviaQA数据集上,通过设置选择性分数阈值,ASPIRE能够更准确地判断出哪些问题的答案不可靠,从而避免生成错误答案;在Natural Questions数据集上,ASPIRE成功降低了错误答案的比例,提高了答案的质量。这些实验证明了ASPIRE框架的高效性和可行性,为大型语言模型的应用提供了重要的支持和保障。
ASPIRE框架的推出填补了大型语言模型在置信度校准方面的空白,为其在实际应用中的稳定性和准确性提供了有力保障。随着这一框架的不断完善和应用,相信大型语言模型在各个领域的表现将会更加出色,为人们带来更好的体验和服务。
0000
评论列表
共(0)条相关推荐
第一批升级iOS 16.5正式版的用户被坑了!
快科技5月21日讯,本周苹果发布了iOS16.5更新,号称修复了超14个漏洞。但很快,安装了更新的iPhone和iPad用户发现,iOS16.5存在一个烦人的BUG,Lightning转USB3相机转换器无法工作。这款配件在苹果官网的售价是320元,可将一个闪电接口扩展为USB3.0Type-A接口和闪电口,用以传输照片、视频或者在连接集线器等,同时还不影响为iOS设备充电。000280%代码秒生成!AI神器Copilot大升级,百万开发者动嘴编码5年内成真
【新智元导读】AI编码神器Copilot模型升级,5年80%的代码自动生成,百万码农提速55%。码农AI神器又升级了!就在刚刚,Github官宣,Copilot模型升级,5年内80%的代码将自动生成。GitHubCopilot发布还不到两年,就已经为100多万的开发者,编写了46%的代码,并提高了55%的编码速度。这次升级究竟改进了什么呢?5年,80%代码自动生成站长网2023-07-31 09:12:220000针对PS的AI插件“Alpaca” 可将草图转为艺术作品
Alpaca是一款专为艺术家设计的个性化AI工具包,旨在帮助用户更深入地探索、更快速地迭代,并发挥创意潜能。它是一个针对AdobePhotoshop的插件,将人工智能图像生成能力与人类技能相结合。体验地址:https://www.alpacaml.com/核心功能:从草图中生成图像:将自己的草图转化为栩栩如生的艺术作品。控制图像生成:从草图和参考图像开始,指导艺术作品的构图。站长网2023-08-14 15:47:330000联发科将开发集成英伟达GPU芯粒的汽车SoC
联发科宣布与英伟达达成合作协议,为软件定义汽车提供完整的AI智能座舱解决方案。在该方案中,联发科将开发汽车SoC,将英伟达GPU芯片集成入其中,并搭载英伟达的AI和图形计算IP。这一芯片支持互连技术,使得芯片间能够流畅高速地互联互通。此外,该方案将运行英伟达的DRIVEOS、DRIVEIX、CUDA和TensorRT软件技术。站长网2023-05-29 15:14:440000