UNC斯坦福等推出通用修正器LURE 多模态物体幻觉下降23%
要点:
1. 多个大学的研究人员开发了名为LURE的通用修正器,旨在解决多模态大模型中的物体幻觉问题,降低幻觉频发的三个成因。
2. LURE通过对幻觉产生的关键因素进行统计分析,包括物体共现、不确定性和物体位置,有效减少幻觉问题。
3. LURE在多个开源多模态大模型上进行了评估,显示通用物体幻觉评估指标提高了23%以上,有效降低幻觉问题。
一项由北卡教堂山、斯坦福、哥大、罗格斯等大学的研究人员合作开发的通用修正器LURE已经面世,旨在应对多模态大模型中出现的物体幻觉问题。这些幻觉问题包括物体共现、不确定性和物体位置,这些问题会对视觉摘要、推理等任务产生负面影响。LURE的设计基于对这些幻觉产生的关键因素进行严格统计分析。

论文地址:https://arxiv.org/abs/2310.00754
代码地址:https://github.com/YiyangZhou/LURE
在研究中,研究人员首先对幻觉问题的三种成因进行了深入分析。他们发现大多数幻觉描述中的物体在训练数据中通常共现,这意味着幻觉物体往往是一起出现的物体。此外,幻觉物体通常是在解码过程中不太确定的物体,这种不确定性会导致模型选择错误的物体。最后,研究人员还观察到,幻觉通常出现在生成文本的后半部分,这可能是前面的输出触发了后续幻觉的滚雪球。
为了解决这些问题,研究团队提出了LURE,这是一种多模态幻觉缓解方案。LURE可以与任意多模态大模型无缝衔接,对不准确的描述进行纠正。在多个开源多模态大模型上进行了评估,结果显示LURE显著降低了幻觉问题,通用物体幻觉评估指标提高了23%以上。此外,LURE还经过人工评估和GPT评估,一直名列前茅,显示了其有效性。
总之,LURE是一项有望解决多模态大模型中幻觉问题的重要工具,通过对关键因素的分析和修正,为这些模型提供更准确的输出,有望在多领域的人工智能应用中产生积极影响。
OpenAI工程师年薪达80万美元,展现稀缺技能巨大市场价值
划重点:👉OpenAI的首席执行官SamAltman因ChatGPT的创始人被撤职,数百名员工威胁辞职,最终OpenAI为了留住这些技术行业中最受重视的员工,重聘了Altman作为首席执行官。这凸显了技术行业最受重视的员工目前具有的巨大影响力。站长网2023-11-23 14:27:400001今日AI:Sora超现实大片震惊好莱坞;IPadapter插件史诗级更新;苹果要推AI应用商店;DALL-E也推局部重绘功能
欢迎来到【今日AI】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。新鲜AI产品点击了解:https://top.aibase.com/📰🤖📢AI新鲜事OpenAI联手视觉艺术家推大作首批7个Sora超现实大片震惊好莱坞【AiBase提要:】站长网2024-03-26 19:02:450001快播公司破产注销 创始人王欣成立云歌人工智能公司
根据天眼查App显示,近期深圳市快播科技有限公司已发生工商变更,经营状态由吊销未注销变为注销,原因是经宣告破产。该公司成立于2007年12月,法定代表人是于璐,注册资本为1000万元人民币,现在由张克东、于璐、刘燕三人共同持股。该公司持有北京快播科技有限公司、深圳市快玩科技有限公司共6家公司的股份,目前这6家公司均处于注销或未注销吊销状态。站长网2023-05-30 13:58:270000抖音再战搜索,成色几何?
失败三次,第四次能成功吗?字节跳动,又出App了。继头条搜索、悟空搜索、闪电搜索之后,独立App“抖音搜索”近日正式上线。目前,“抖音搜索”已在华为和vivo应用商城上线,暂未上线苹果AppStore。经过「定焦」测试发现,打开“抖音搜索”App首先会弹出用户相关联的抖音账号。首页以搜索框为主,下滑是短视频的双列瀑布流。而“视频”页则是完全移植抖音的界面和内容,通过下滑刷新视频内容。站长网2024-09-04 20:33:280000一亿赔付之争:大主播翻车,赔偿全凭良心
辛巴和小杨哥的赔付之争,打了整个直播电商行业的脸。临近中秋节,头部主播们也忙了起来,忙着“翻车”,忙着赔付。交个朋友公开发文,称被品牌方混淆视听,上架了“李鬼”月饼,决定自掏腰包进行“退一赔三”。站长网2024-09-14 02:33:160000