UNC斯坦福等推出通用修正器LURE 多模态物体幻觉下降23%
要点:
1. 多个大学的研究人员开发了名为LURE的通用修正器,旨在解决多模态大模型中的物体幻觉问题,降低幻觉频发的三个成因。
2. LURE通过对幻觉产生的关键因素进行统计分析,包括物体共现、不确定性和物体位置,有效减少幻觉问题。
3. LURE在多个开源多模态大模型上进行了评估,显示通用物体幻觉评估指标提高了23%以上,有效降低幻觉问题。
一项由北卡教堂山、斯坦福、哥大、罗格斯等大学的研究人员合作开发的通用修正器LURE已经面世,旨在应对多模态大模型中出现的物体幻觉问题。这些幻觉问题包括物体共现、不确定性和物体位置,这些问题会对视觉摘要、推理等任务产生负面影响。LURE的设计基于对这些幻觉产生的关键因素进行严格统计分析。
论文地址:https://arxiv.org/abs/2310.00754
代码地址:https://github.com/YiyangZhou/LURE
在研究中,研究人员首先对幻觉问题的三种成因进行了深入分析。他们发现大多数幻觉描述中的物体在训练数据中通常共现,这意味着幻觉物体往往是一起出现的物体。此外,幻觉物体通常是在解码过程中不太确定的物体,这种不确定性会导致模型选择错误的物体。最后,研究人员还观察到,幻觉通常出现在生成文本的后半部分,这可能是前面的输出触发了后续幻觉的滚雪球。
为了解决这些问题,研究团队提出了LURE,这是一种多模态幻觉缓解方案。LURE可以与任意多模态大模型无缝衔接,对不准确的描述进行纠正。在多个开源多模态大模型上进行了评估,结果显示LURE显著降低了幻觉问题,通用物体幻觉评估指标提高了23%以上。此外,LURE还经过人工评估和GPT评估,一直名列前茅,显示了其有效性。
总之,LURE是一项有望解决多模态大模型中幻觉问题的重要工具,通过对关键因素的分析和修正,为这些模型提供更准确的输出,有望在多领域的人工智能应用中产生积极影响。
iQOO Neo 8全系搭载 V1+ 自研芯片
今日,iQOO手机官方宣布,iQOONeo8系列将成为Neo系列中首款全系搭载自研V1芯片的产品。V1作为vivo的自研芯片,采用硬件化封装,支持三个算法,具有等效32MB主机级片上高速缓存,至高25GB/s数据吞吐理论速度以及至高144Hz的特点,能够显著增强视效并降低功耗。此外,V1能够对夜景视频进行更精细的调优,并利用视频降噪算法实现小于1lux环境下的极夜视频功能。站长网2023-05-15 16:31:210009淘宝将支持“仅退款” 提供更好的购物体验
近日,淘宝发布了关于变更《淘宝平台争议处理规则》的公示通知,该规则已于昨日正式生效。这一变更意味着继拼多多和抖音之后,淘宝也推出了“仅退款”的售后机制。这一机制旨在为消费者提供更好的购物体验,并对服务不到位、质量不可靠的商家采取更严格的措施。根据新规,淘宝将基于平台自身的大数据能力,识别多维度信息,对符合相关情形的售后请求作出快速退款或退货退款的决策依据。站长网2023-12-27 14:09:140000库克总薪较前年缩水超3500万美元 同比下降 36%
苹果公司近日发布了年度报告,详细披露了公司高管薪酬、股东提案等重要信息。其中,首席执行官蒂姆·库克的薪酬成为关注的焦点。根据报告,库克在2023年的总收入为6320万美元,比2022年的9940万美元收入下降了约36%。虽然这一数字高于他2023年目标薪酬4900万美元,但与2022年的收入相比,仍然有所下滑。0000宾夕法尼亚州政府将准备在其业务中使用AI
文章概要:1.宾夕法尼亚州政府计划使用人工智能(AI)来改善其运营,包括成立AI管理委员会、制定AI使用原则和培训政府员工。2.州长乔什·夏皮罗表示,州政府将积极适应AI的发展,确保其在私营部门中安全使用,并招募AI专家参与政府机构的AI整合。3.宾夕法尼亚州政府计划启动为期两年的AI专家招聘项目,并已开始咨询AI专家以防范AI驱动的威胁,如欺诈。站长网2023-09-21 18:23:070000一次通过率73%,开源代码大模型WizardCoder超越最新GPT-4以外所有闭/开源模型
这几天,代码大模型领域又热闹了起来!先是Meta开源代码专用大模型CodeLlama,且免费商用。效果也非常好,CodeLlama在HumanEval和MBPP代码数据集上的一次生成通过率(pass@1)轻松超越GPT-3.5,其中「Unnatural」版本的pass@1逼近了原始GPT-4(OpenAI在今年3月GPT-4技术报告中的数据)。站长网2023-08-28 14:01:410004