UNC斯坦福等推出通用修正器LURE 多模态物体幻觉下降23%
要点:
1. 多个大学的研究人员开发了名为LURE的通用修正器,旨在解决多模态大模型中的物体幻觉问题,降低幻觉频发的三个成因。
2. LURE通过对幻觉产生的关键因素进行统计分析,包括物体共现、不确定性和物体位置,有效减少幻觉问题。
3. LURE在多个开源多模态大模型上进行了评估,显示通用物体幻觉评估指标提高了23%以上,有效降低幻觉问题。
一项由北卡教堂山、斯坦福、哥大、罗格斯等大学的研究人员合作开发的通用修正器LURE已经面世,旨在应对多模态大模型中出现的物体幻觉问题。这些幻觉问题包括物体共现、不确定性和物体位置,这些问题会对视觉摘要、推理等任务产生负面影响。LURE的设计基于对这些幻觉产生的关键因素进行严格统计分析。

论文地址:https://arxiv.org/abs/2310.00754
代码地址:https://github.com/YiyangZhou/LURE
在研究中,研究人员首先对幻觉问题的三种成因进行了深入分析。他们发现大多数幻觉描述中的物体在训练数据中通常共现,这意味着幻觉物体往往是一起出现的物体。此外,幻觉物体通常是在解码过程中不太确定的物体,这种不确定性会导致模型选择错误的物体。最后,研究人员还观察到,幻觉通常出现在生成文本的后半部分,这可能是前面的输出触发了后续幻觉的滚雪球。
为了解决这些问题,研究团队提出了LURE,这是一种多模态幻觉缓解方案。LURE可以与任意多模态大模型无缝衔接,对不准确的描述进行纠正。在多个开源多模态大模型上进行了评估,结果显示LURE显著降低了幻觉问题,通用物体幻觉评估指标提高了23%以上。此外,LURE还经过人工评估和GPT评估,一直名列前茅,显示了其有效性。
总之,LURE是一项有望解决多模态大模型中幻觉问题的重要工具,通过对关键因素的分析和修正,为这些模型提供更准确的输出,有望在多领域的人工智能应用中产生积极影响。
Midjourney最新V6版本引争议 生成画作被指涉嫌版权侵权
概要:-Midjourney最新版本更新引发用户抱怨,称其文本生成结果过于相似于已知版权艺术品。-描述了艺术家ReidSouthen通过指定关键词测试后,发现生成的图像与多部电影中的场景几乎一模一样,并因此遭到Midjourney的封禁。-争议引起AI研究者GaryMarcus的关注,他表示Midjourney可能使用高分辨率的版权图像进行训练,但公司尚未回应。0000右脑科技RightBrain AI完成连续两轮数千万融资
今日,AIGC技术公司右脑科技(RightBrainAI)宣布完成数千万元天使轮融资,本轮投资由光速光合领投,老股东奇绩创坛跟投。此次融资资金将主要用于算法研发、产品开发和团队扩充。据介绍,右脑科技团队拥有国内领先的视觉内容生成模型研发经验和实力,3位创始人均来自北京大学,集合了微软亚洲研究院、商汤研究院、智源研究院的国内顶尖AI研究背景。站长网2023-06-05 21:07:040000昆仑万维:天工大模型推理能力超过GPT-3.5和LLaMA2
昆仑万维表示,其自研的天工大模型在BenchmarkGSM8K测试中取得了80%的正确率,超过了GPT-3.5和LLaMA2-70B,达到了全球领先水平,接近于GPT-4。天工大模型还在MMLU、C-EVAL、HumanEval等多个数据集上表现出色,准确率均高于其他主流大模型。同样,在中文开源数据集CMATH测试中,天工大模型也表现优秀,准确率超过了其他主流大模型。站长网2023-09-18 08:34:110000研究显示为人工智能生成图像添加水印以打击虚假信息和深度伪造可能毫无意义
站长之家(ChinaZ.com)10月7日消息:今年7月,白宫宣布,七家大型科技公司已承诺采取人工智能安全措施,包括部署水印,以确保算法生成的内容可以与真人作品区分开来。在这些巨头中,亚马逊、谷歌和OpenAI都特别提到了水印技术——即在文本和图像中添加信息以证明内容出处的技术——作为抵御其生成式人工智能模型所产生的错误信息、欺诈和深度伪造的一种方法。站长网2023-10-07 14:19:560000健身平台Keep登陆港股上市 首日高开近5%
今日,运动科技公司keep正式在港股上市,首日高开近5%,报30.3港元。根据此前公司公告,Keep计划全球发售1083.9万股,其中国际发售975.5万股,占比九成;公开发售108.4万股,另有15%的超额配股权。IPO股票发行价为每股28.92港元,将净筹资1.92亿港元。站长网2023-07-12 17:26:060001