UNC斯坦福等推出通用修正器LURE 多模态物体幻觉下降23%

站长网2023-11-06 15:07:230阅

要点:

1. 多个大学的研究人员开发了名为LURE的通用修正器，旨在解决多模态大模型中的物体幻觉问题，降低幻觉频发的三个成因。

2. LURE通过对幻觉产生的关键因素进行统计分析，包括物体共现、不确定性和物体位置，有效减少幻觉问题。

3. LURE在多个开源多模态大模型上进行了评估，显示通用物体幻觉评估指标提高了23%以上，有效降低幻觉问题。

一项由北卡教堂山、斯坦福、哥大、罗格斯等大学的研究人员合作开发的通用修正器LURE已经面世，旨在应对多模态大模型中出现的物体幻觉问题。这些幻觉问题包括物体共现、不确定性和物体位置，这些问题会对视觉摘要、推理等任务产生负面影响。LURE的设计基于对这些幻觉产生的关键因素进行严格统计分析。

论文地址:https://arxiv.org/abs/2310.00754

代码地址:https://github.com/YiyangZhou/LURE

在研究中，研究人员首先对幻觉问题的三种成因进行了深入分析。他们发现大多数幻觉描述中的物体在训练数据中通常共现，这意味着幻觉物体往往是一起出现的物体。此外，幻觉物体通常是在解码过程中不太确定的物体，这种不确定性会导致模型选择错误的物体。最后，研究人员还观察到，幻觉通常出现在生成文本的后半部分，这可能是前面的输出触发了后续幻觉的滚雪球。

为了解决这些问题，研究团队提出了LURE，这是一种多模态幻觉缓解方案。LURE可以与任意多模态大模型无缝衔接，对不准确的描述进行纠正。在多个开源多模态大模型上进行了评估，结果显示LURE显著降低了幻觉问题，通用物体幻觉评估指标提高了23%以上。此外，LURE还经过人工评估和GPT评估，一直名列前茅，显示了其有效性。

总之，LURE是一项有望解决多模态大模型中幻觉问题的重要工具，通过对关键因素的分析和修正，为这些模型提供更准确的输出，有望在多领域的人工智能应用中产生积极影响。

UNC斯坦福等推出通用修正器LURE多模态物体幻觉下降23

0000

评论列表

共(0)条

相关推荐

站长资讯
OpenAI工程师年薪达80万美元，展现稀缺技能巨大市场价值
划重点:👉OpenAI的首席执行官SamAltman因ChatGPT的创始人被撤职，数百名员工威胁辞职，最终OpenAI为了留住这些技术行业中最受重视的员工，重聘了Altman作为首席执行官。这凸显了技术行业最受重视的员工目前具有的巨大影响力。
站长网2023-11-23 14:27:40
0001
站长资讯
今日AI：Sora超现实大片震惊好莱坞；IPadapter插件史诗级更新；苹果要推AI应用商店；DALL-E也推局部重绘功能
欢迎来到【今日AI】栏目!这里是你每天探索人工智能世界的指南，每天我们为你呈现AI领域的热点内容，聚焦开发者，助你洞悉技术趋势、了解创新AI产品应用。新鲜AI产品点击了解：https://top.aibase.com/📰🤖📢AI新鲜事OpenAI联手视觉艺术家推大作首批7个Sora超现实大片震惊好莱坞【AiBase提要:】
站长网2024-03-26 19:02:45
0001
站长资讯
快播公司破产注销创始人王欣成立云歌人工智能公司
根据天眼查App显示，近期深圳市快播科技有限公司已发生工商变更，经营状态由吊销未注销变为注销，原因是经宣告破产。该公司成立于2007年12月，法定代表人是于璐，注册资本为1000万元人民币，现在由张克东、于璐、刘燕三人共同持股。该公司持有北京快播科技有限公司、深圳市快玩科技有限公司共6家公司的股份，目前这6家公司均处于注销或未注销吊销状态。
站长网2023-05-30 13:58:27
0000
站长资讯
抖音再战搜索，成色几何？
失败三次，第四次能成功吗?字节跳动，又出App了。继头条搜索、悟空搜索、闪电搜索之后，独立App“抖音搜索”近日正式上线。目前，“抖音搜索”已在华为和vivo应用商城上线，暂未上线苹果AppStore。经过「定焦」测试发现，打开“抖音搜索”App首先会弹出用户相关联的抖音账号。首页以搜索框为主，下滑是短视频的双列瀑布流。而“视频”页则是完全移植抖音的界面和内容，通过下滑刷新视频内容。
站长网2024-09-04 20:33:28
0000
站长资讯
一亿赔付之争：大主播翻车，赔偿全凭良心
辛巴和小杨哥的赔付之争，打了整个直播电商行业的脸。临近中秋节，头部主播们也忙了起来，忙着“翻车”，忙着赔付。交个朋友公开发文，称被品牌方混淆视听，上架了“李鬼”月饼，决定自掏腰包进行“退一赔三”。
站长网2024-09-14 02:33:16
0000