维基百科+大模型打败幻觉！斯坦福WikiChat性能领先GPT-4

站长网2024-01-04 09:59:340阅

要点:

1. 维基百科大模型打败幻觉，斯坦福WikiChat在事实准确性和其他指标上表现优秀。

2. 斯坦福研究人员利用维基百科数据训练大模型WikiChat，成功减轻了幻觉问题，并在事实准确性和对话性方面超过了其他模型。

3. 通过优化和改进，WikiChat在各个方面的性能都显著领先，尤其在事实准确性方面达到了97.3%。

斯坦福大学的研究人员利用维基百科数据训练了一个大模型，命名为WikiChat，通过优化和改进，成功解决了大模型的幻觉问题，并在事实准确性和其他指标上表现优秀。他们的最佳模型在新的基准测试中获得了97.3%的事实准确性，远远超过了GPT-4的66.1%。此外，WikiChat还在相关性、信息性、自然性、非重复性和时间正确性方面领先其他模型。

论文地址:https://aclanthology.org/2023.findings-emnlp.157.pdf

项目代码:https://top.aibase.com/tool/wikichat

为了解决幻觉问题，研究人员采用了检索增强生成（RAG）的方法，并添加了几个重要步骤来进一步减轻幻觉，并改进对话性指标。通过这些优化，WikiChat在事实准确性方面比微调后的SOTA RAG模型Atlas高出8.5%。此外，研究人员还将基于GPT-4的WikiChat提炼成7B参数的LLaMA模型，这个模型在事实准确性方面能达到91.1%的高分，并且运行速度提高了6.5倍，能效更好，可以本地部署。

然而，解决大模型的幻觉问题并不容易。一般情况下，当检索不到相关信息或知识库中没有相关信息时，大模型会产生幻觉来填补空白。为了解决这个问题，WikiChat通过汇总和过滤检索到的信息，而不是直接生成响应。同时，研究人员还教导了LLM理解时间背景，以及在必要时让系统说「我不知道」。

通过结合大模型和维基百科数据，研究人员成功地提高了聊天机器人的性能。WikiChat的成功表明，维基百科数据在大模型训练中发挥了重要作用，通过检索增强生成的方法，可以有效解决大模型的幻觉问题，提高模型的事实准确性和对话性能。

维基百科x2B大模型打败幻觉斯坦福WikiChat性能领先GPT4

0000

评论列表

共(0)条

相关推荐

站长资讯
这届高考，忙坏了AI考生
又到了全民围观高考作文的日子了。与往年不同的是，今年这届高考考生赶上了AI大年。微博上，#AI写高考作文#与#高考语文#、#高考作文#、#高考作文简单#等高考相关话题一同稳居热搜榜。全国甲卷“时间的仆人”一题更是在语文考试刚结束时迅速登上热搜，并出现在很多玩家的“AI写高考作文”测试中。
站长网2023-06-08 07:23:20
0000
站长资讯
B站将上线“创作者声明”功能发布AI生成内容需添加声明
B站发布《关于“主动添加内容标识”的公告》称，将在9月20日，上线“创作者声明”功能。该功能可以帮助UP主在发布稿件时，补充对稿件的作者声明。如果创作者选择的声明与稿件内容不符，社区可能会将错误声明进行编辑或修改。创作者需要添加的标识主要包括以下几类:1.发布原创涉及国内外时事、公共政策、社会事件等相关内容时，需要在稿件简介中标明拍摄时间、地点;
站长网2023-09-14 21:40:18
0000
站长资讯
日本航天局与铁路公司合作，利用人工智能预测轨道上的故障
划重点:-🛰️日本航天局（JAXA）与西日本旅客铁路公司(JR-West)合作，将后者的人工智能(AI)故障预测技术应用于卫星操作。-🚂这项合作旨在利用数据来预测工作卫星的故障，并解决它们，就像铁路设备维护一样。-🌐卫星运营商SKYPerfectJSATCorporation也参与其中，旨在通过改进AI模型的开发来检测轨道上的异常情况。
站长网2024-05-24 17:57:28
0001
苹果宣布Apple Intelligence 4月新增多语言支持：简体中文在列
快科技2月1日消息，苹果公司宣布，AppleIntelligence将在4月通过软件更新获得更多语言支持，包括法语、德语、意大利语、葡萄牙语、西班牙语、日语、韩语和简体中文，以及新加坡和印度的本地化英语。此外，越南语也将被纳入支持范围。这一消息由苹果首席执行官蒂姆库克在公司2024年第四季度财报电话会议上宣布。
站长网站长资讯2025-02-04 07:31:44
0000
站长资讯
性能之王！一加Ace 3 Pro启用全新Logo
快科技6月15日消息，{tag_keyurl_3}李杰预告，一加Ace3Pro将在下周正式开启预热。为了迎接一加Ace3Pro的到来，一加Ace系列启用全新Logo，李杰表示，AcePerformance代表着最强的性能实力，关于这个标志，还有一些小故事，我后面和大家聊聊。
站长网2024-06-17 01:54:36
0000