亚马逊Alexa AI研究人员推QUADRo:超过44万个标注示例,增强QA系统的突破性资源
划重点:
- 🧠 人工智能和机器学习的能力使它们成功进入各行各业,尤其是大语言模型(LLMs)和问答系统的引入推动了人工智能社区的发展。
- 📘 提出了一个名为QUADRo的新型开放领域标注资源,旨在解决数据库问答系统中训练和测试数据不足的问题,提供了15,211个问题的30个相关问答对,总共超过44万个标注样本。
- 🛠 研究团队通过实验证明QUADRo在培训方法、输入模型配置和答案相关性等关键QA系统组件上的表现,为解决自动质量保证系统中的数据问题提供了有力支持。
人工智能(AI)和机器学习(ML)的能力使它们成功地渗透到几乎每个可能的行业。随着大语言模型(LLMs)和问答系统的引入,尤其是近年来,AI社区取得了巨大的进展。在自动问答(QA)系统的开发中,从包含问题-答案对的预先计算数据库中高效检索答案是一个常见的步骤。
研究指出了两种主要的QA范式:开放式书本和闭合式书本。开放式书本采用检索和阅读的两步过程,从庞大的文档语料库(通常是互联网)中获取相关材料,然后通过应用不同的模型和方法从获取的内容中提取解决方案。闭合式方法则更为最新,依赖于训练中学到的技能,这些模型通常基于Seq2Seq模型(如T5),在不使用外部语料库的情况下生成结果。
图源备注:图片由AI生成,图片授权服务商Midjourney
尽管闭合式技术表现出色,但它们对许多工业应用来说过于资源密集,对系统性能构成重大风险。数据库问答(DBQA)是另一种方法,它从预生成的问题-答案对数据库中检索答案,而不依赖于模型或大型语料库参数中包含的信息。
然而,DBQA技术在检索和排名模型开发方面面临着重要的问题,主要是由于现有资源在范围和内容上的不足。为了克服这些挑战,一组研究人员提出了一个名为QUADRo的数据集和模型,用于问答数据库检索。这是一个新的、开放领域的标注资源,专门用于训练和评估模型。
QUADRo包含15,211个输入问题的每个问题都有30个相关的问答对,总计超过44万个标注样本。对每对的重要性进行了二进制指示,与输入查询的关系明确标记。
研究团队进行了深入的实验,评估了该资源在与QA系统组件的几个重要方面的质量和特性。这些元素包括培训方法、输入模型配置和答案的相关性。实验证明了该方法在检索相关响应方面的出色表现,通过检查在该数据集上训练的模型的行为和性能。
总的来说,这项研究通过引入一个有用的资源并对其属性进行仔细评估,解决了自动质量保证系统中训练和测试数据不足的问题。对培训策略和答案相关性等重要元素的强调有助于更全面地了解这一领域。
论文网址:https://www.amazon.science/publications/quadro-dataset-and-models-for-question-answer-database-retrieval
黄仁勋身家首次突破1000亿美元 位列全球富豪榜第 15 位
英伟达公司的创始人兼CEO黄仁勋近日迎来了职业生涯的又一里程碑——他的个人资产净值首次突破1000亿美元,位列全球富豪榜第15位。这一突破不仅彰显了黄仁勋在科技领域的卓越成就,也预示着他可能在全球财富格局中扮演更加重要的角色。站长网2024-05-30 09:20:230000Zoo:一个提示词可同时体验8种AI绘画模型
Zoo是一个开源项目,提供了多个文本到图像生成AI模型。它们使用先进的深度学习技术,可以根据给定的文字描述生成出美丽的1024x1024分辨率的图像。https://zoo.replicate.dev/?id=52cbd5c9-7507-4c9f-85ff-cf625ca66426站长网2023-08-04 15:07:270000B站新推百大UP主:正面写着名字,背面写着“赚钱”
1月2日,B站发布2023年度百大UP主名单。作为每年平台最具代表意义的年度盘点,这份榜单再度引发网友的讨论。《天下网商》观察了此次评选的100位百大UP主,发现几个特点:几乎所有上榜的UP主都拥有较稳定的商单合作关系,部分UP主几乎每条视频都有商家或平台促销的广告植入;0000Devin第一手使用体验:完成度很高,开始编码就停不下来,但要替代程序员还很远
【新智元导读】Devin到底是一个漂亮的Demo,还是一个已经能替代程序员的智能体,使用体验怎么,拿到测试资格的网友第一时间分享了自己的体验。由10枚IOI金牌在手的创业团队CognitionAI开发的全球首个AI程序员智能体Devin,一发布就让科技圈坐立不安。在演示中,Devin几乎已经可以独立完成很多人类程序员需要大量时间才能完成的工作,效果一点不比普通程序员差。站长网2024-03-16 20:13:040001腾讯发布智驾云图 将与车企共建汽车行业大模型
在今日的2023腾讯全球数字生态大会上,腾讯集团副总裁钟翔平表示,腾讯将与一些车企共建汽车行业大模型,包括座舱大模型、智能驾驶训练大模型、智能客服大模型等。腾讯还发布了面向自动驾驶、舱驾一体的地图服务平台——腾讯智驾云图,通过实时车端感知数据进行云端多程建图,降低建图成本、提升数据鲜度,并与自动驾驶实时连接。站长网2023-09-08 14:16:310001