登陆注册
17550

AI聊天机器人WikiChat:通过检索维基数据终结LLM幻觉 对话准确率比GPT-4高55%

站长网2024-01-09 11:32:240

**划重点:**

1. 🚀 WikiChat通过维基百科检索数据,有效阻止大型语言模型的幻觉。

2. 🌐 项目使用ColBERT进行信息检索,并通过七阶段流程确保响应准确。

3. 🌐WikiChat 在与人类用户就最新话题进行对话时达到了97.9% 的事实准确率,比 GPT- 4 高55%

WikiChat是一项通过从维基百科检索数据来阻止大型语言模型的幻觉的AI聊天机器人。在当今大语言模型如ChatGPT和GPT-4经常在处理最新信息或者有关较不流行话题的信息时时出现错误的情况下,WikiChat采用维基百科和七阶段流程,确保其响应是基于事实的。

WikiChat几乎从不产生幻觉,并且具有高对话性和低延迟。WikiChat以英语维基百科为基础,英语维基百科是最大的精选自由文本语料库。

WikiChat 仅LLM保留有根据的事实,并将它们与从语料库中检索到的其他信息相结合,以形成事实和引人入胜的响应。我们将基于 GPT-4的 WikiChat 提炼成7B 参数的 LLaMA 模型,质量损失最小,以显着改善其延迟、成本和隐私,并促进研究和部署。

研究人员使用一种新颖的混合人类和LLM评估方法,使得该系统系统在模拟对话中实现了97.3% 的事实准确率。与 GPT-4相比,它明显优于所有基于检索和基于检索的基线,在头部、尾部和LLM最新知识方面分别高出3.9%、38.6% 和51.0%。与以前最先进的基于检索的聊天机器人相比,WikiChat的信息量和吸引力也明显更高,就像一个LLM。

在测试中,WikiChat 在与人类用户就最新话题进行对话时达到了97.9% 的事实准确率,比 GPT-4高55.0%,同时获得了更高的用户评分和更有利的评论。

通过WikiChat,我们有望有效应对大型语言模型的幻觉问题,使得这些模型在提供信息时更加可靠和准确。

项目网址:https://top.aibase.com/tool/wikichat

论文网址:https://arxiv.org/abs/2305.14292v2

0000
评论列表
共(0)条