UNC斯坦福等推出通用修正器LURE 多模态物体幻觉下降23%
要点:
1. 多个大学的研究人员开发了名为LURE的通用修正器,旨在解决多模态大模型中的物体幻觉问题,降低幻觉频发的三个成因。
2. LURE通过对幻觉产生的关键因素进行统计分析,包括物体共现、不确定性和物体位置,有效减少幻觉问题。
3. LURE在多个开源多模态大模型上进行了评估,显示通用物体幻觉评估指标提高了23%以上,有效降低幻觉问题。
一项由北卡教堂山、斯坦福、哥大、罗格斯等大学的研究人员合作开发的通用修正器LURE已经面世,旨在应对多模态大模型中出现的物体幻觉问题。这些幻觉问题包括物体共现、不确定性和物体位置,这些问题会对视觉摘要、推理等任务产生负面影响。LURE的设计基于对这些幻觉产生的关键因素进行严格统计分析。
论文地址:https://arxiv.org/abs/2310.00754
代码地址:https://github.com/YiyangZhou/LURE
在研究中,研究人员首先对幻觉问题的三种成因进行了深入分析。他们发现大多数幻觉描述中的物体在训练数据中通常共现,这意味着幻觉物体往往是一起出现的物体。此外,幻觉物体通常是在解码过程中不太确定的物体,这种不确定性会导致模型选择错误的物体。最后,研究人员还观察到,幻觉通常出现在生成文本的后半部分,这可能是前面的输出触发了后续幻觉的滚雪球。
为了解决这些问题,研究团队提出了LURE,这是一种多模态幻觉缓解方案。LURE可以与任意多模态大模型无缝衔接,对不准确的描述进行纠正。在多个开源多模态大模型上进行了评估,结果显示LURE显著降低了幻觉问题,通用物体幻觉评估指标提高了23%以上。此外,LURE还经过人工评估和GPT评估,一直名列前茅,显示了其有效性。
总之,LURE是一项有望解决多模态大模型中幻觉问题的重要工具,通过对关键因素的分析和修正,为这些模型提供更准确的输出,有望在多领域的人工智能应用中产生积极影响。
Photoshop重大更新!集成Adobe Firefly Image 3 Model 图像灵活度提升
AdobePhotoshop迎来了一次重大更新,通过集成AdobeFireflyImage3Model,引入了多项新的AI功能,这些功能大幅提升了图像编辑的深度与灵活性。这次的更新不仅优化了图像生成的过程,还让用户能够以前所未有的控制度和精准度实现其创意构想。关键新AI功能如下:生成填充和生成扩展:这些功能允许用户基于文本提示快速生成或扩展图像,使创建或扩展场景变得更加无缝。站长网2024-04-24 14:13:530000国产AI包围iPhone 16
在中国市场,苹果的元气还是没能恢复过来。北京时间11月1日凌晨,苹果公布了2024财年第四季度(即2024年第三季度)财务业绩。财报显示,苹果该季度营收949亿美元,同比增长6%,净利润147亿美元,同比下降36%。值得注意的是,大中华区继续成为苹果三季度唯一收入同比下降的区域,更糟糕的是,在中国市场,这已经是苹果连续第五个季度遭遇营收同比下滑。站长网2024-11-03 09:21:140000余承东宣布华为天生会画APP正式版8月6日上线
华为的余承东今日展示了一幅精美的画作,这副作品是利用华为即将在8月6日发布的新款MatePadPro平板电脑以及天生会画App的正式版完成的。这款App配备了华为最新研发的空中绘画笔刷技术。余承东透露,天生会画App在公测期间根据用户反馈进行了多项功能优化,以提升绘画效果和用户体验。这款强大的绘画软件将在8月6日正式推出。站长网2024-07-31 17:20:280000阿里云四大金刚简史
阿里集团分拆后,所有人都想知道,谁会成为最先上市的新公司。一定程度上,这代表业务独立性强,潜力大,也更受资本市场欢迎。阿里云智能是热门选手之一。在官方给出的实施方案中,以阿里云和钉钉为核心的云智能业务是拆分最彻底的板块。在股权和公司治理上,是一家与阿里集团完全独立的新公司。时间表也已经给出:未来12个月内完成拆分和上市。站长网2023-06-10 08:59:510000今日AI:马斯克开源最大模型Grok-1;不等OpenAI!国产类Sora抢先开源;iPhone很快可直接使用Gemini模型;Kimi Chat超长上下文免费用
欢迎来到【今日AI】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。新鲜AI产品点击了解:https://top.aibase.com/📰🤖📢AI新鲜事马斯克开源Grok-1:3140亿参数迄今最大,权重架构全开放【AiBase提要:】站长网2024-03-19 03:09:120001