GenAudit:帮用户根据输入证据对LLM生成内容进行事实检查
划重点:
💡 最近,研究人员提出了GENAUDIT,一种专门用于帮助核查基于文档基础的LLM回复的工具。
💡 GENAUDIT通过建议对语言模型生成的响应进行更改来发挥作用,并从参考文档中突出显示不符合要求的陈述,并建议对响应进行更改或删除。
💡 为了构建GENAUDIT,已经训练了专门设计用于执行这些任务的模型,这些模型已经被教导从参考文档中提取证据以支持事实陈述,识别不支持的主张,并推荐合适的修改。
近年来,随着人工智能(AI)和主要是生成式AI领域的进展,已经展示了大型语言模型(LLMs)生成文本以响应输入或提示的能力。这些模型能够像人类一样生成文本,回答问题,总结长篇文本段落等。然而,即使在访问参考资料之后,它们也不完美,可能会产生错误。这样的错误可能会在银行业或医疗保健等重要应用中产生严重后果。
为了解决这个问题,一组研究人员最近提出了GENAUDIT,这是一种专门用于帮助核查基于文档基础的LLM回复的工具。GENAUDIT的功能是通过建议对语言模型生成的响应进行更改来发挥作用。它突出显示参考文档中不符合要求的陈述,并建议对响应进行更改或删除。它还提供了来自参考文本的证据,以支持LLM的事实陈述。

为了构建GENAUDIT,已经训练了专门设计用于执行这些任务的模型。这些模型已经被教导从参考文档中提取证据以支持事实陈述,识别不支持的主张,并推荐合适的修改。GENAUDIT具有交互式界面,可帮助进行决策和用户交互。借助此界面,用户可以检查和批准推荐的调整和支持文件。
团队表示,已经通过人工评估对GENAUDIT进行了深入评估,评估人员通过检查它在多个类别中的表现来评估其性能,查看它在总结文件时如何准确识别LLM输出中的缺陷。评估结果表明,GENAUDIT能够准确地识别出来自八种不同LLM的输出中的缺陷,涵盖了多个领域。

为了优化GENAUDIT的错误检测性能,团队建议了一种技术,该技术在减少精度损失的同时最大化错误召回率。该策略确保系统在保持准确性水平基本不变的同时,能够检测到大部分的故障。
团队总结了他们的主要贡献如下:
1.引入了GENAUDIT,这是一种支持基于文档的任务中的事实核查语言模型输出的工具。该工具突出显示了LLM生成的内容中陈述的支持数据,找出了缺陷,并提供了解决方案。
2.评估并提供了用于事实核查的后端模型的优化LLMs。这些版本在少量数据条件下性能相当,尤其是与最先进的专有LLMs相比。
3.对GENAUDIT在检查来自三个不同领域的文件的八种不同LLM生成的摘要中存在的错误的有效性进行了评估。
4.介绍并评估了一种在解码时间使用的技术,旨在通过牺牲精度的微小降低来提高错误检测召回率。这种方法在保持整体准确性的同时增强了错误检测的能力。
GENAUDIT是一款优秀的工具,有助于改善具有强大文档基础的任务中的事实核查程序,并提高LLM生成的信息在重要应用中的可靠性。
产品入口:https://top.aibase.com/tool/genaudit
苹果关闭圣地亚哥人工智能团队 121名员工或将失业
根据知情人士透露,苹果公司计划关闭位于圣地亚哥的一个与人工智能业务相关的团队,共计121人,导致许多员工可能面临被解雇的风险。这个名为DataOperationsAnnotations的团队被告知,他们将被迫搬迁到奥斯汀,并与同一团队的德克萨斯州部分合并。站长网2024-01-15 11:42:030001英国情报机构希望放宽关于AI训练数据的法律限制
英国情报机构正在争取放宽人工智能数据使用的法律限制,以便更轻松地训练人工智能模型。具体来说,英国情报机构GCHQ、MI6和MI5正在游说政府放宽监控法规,他们认为这些法规对他们使用大量个人数据训练人工智能模型的能力构成了“繁琐的”限制。他们希望放松旨在保护个人隐私和防止敏感信息滥用的安全措施,以便更轻松地使用特定类型的数据。站长网2023-08-03 12:04:110000小米15系列AI大升级:AI字幕来了 看片、会议实时翻译
快科技10月29日消息,今晚小米15系列发布会举办,小米15首发搭载小米澎湃OS2。据官方介绍,小米澎湃OS2通过AI技术重塑系统应用,包括AI写作、AI识音、AI字幕和AI妙画等,全面革新了效率。其中,AI字幕功能支持全局实时翻译,让用户在观看国外影片、开国外会议时不再担心语言障碍,跨国会议也能实现同声传译。此外,AI写作作为全局文字工具,支持润色改写,极大提升了生产力。站长网2024-10-29 22:09:510000美团宣布收购光年之外 后者为王慧文AI创业公司
6月29日,美团在港交所公告称,已订立交易协议以收购光年之外的全部权益,总代价包括现金233,673,600美元;债务承担人民币366,924,000元;及现金人民币1.00元。光年之外由美团联合创始人、公司前董事及关连人士王慧文创立及控制。于转让协议(互为条件)交割完成后,美团将持有光年之外集团的100%权益。站长网2023-06-30 08:40:200000天图万境团队推出视频配音工具Sora Opera 实现视频解除“静音模式”
国内团队天图万境发布了名为SoraOpera的视频音频通用工具,这款工具不仅可以为AI生成的视频配音,还能对已存在的视频进行重新配音。上周六,视频工具Pika宣布用户可以为生成的视频添加配乐和音效,同时也可以为之前生成的静音视频添加音效。这项功能现已解除了视频的“静音模式”,但需要用户购买Pika会员才能体验。站长网2024-03-14 11:57:060000