AI聊天机器人WikiChat:通过检索维基数据终结LLM幻觉 对话准确率比GPT-4高55%
**划重点:**
1. 🚀 WikiChat通过维基百科检索数据,有效阻止大型语言模型的幻觉。
2. 🌐 项目使用ColBERT进行信息检索,并通过七阶段流程确保响应准确。
3. 🌐WikiChat 在与人类用户就最新话题进行对话时达到了97.9% 的事实准确率,比 GPT- 4 高55%
WikiChat是一项通过从维基百科检索数据来阻止大型语言模型的幻觉的AI聊天机器人。在当今大语言模型如ChatGPT和GPT-4经常在处理最新信息或者有关较不流行话题的信息时时出现错误的情况下,WikiChat采用维基百科和七阶段流程,确保其响应是基于事实的。
WikiChat几乎从不产生幻觉,并且具有高对话性和低延迟。WikiChat以英语维基百科为基础,英语维基百科是最大的精选自由文本语料库。
WikiChat 仅LLM保留有根据的事实,并将它们与从语料库中检索到的其他信息相结合,以形成事实和引人入胜的响应。我们将基于 GPT-4的 WikiChat 提炼成7B 参数的 LLaMA 模型,质量损失最小,以显着改善其延迟、成本和隐私,并促进研究和部署。
研究人员使用一种新颖的混合人类和LLM评估方法,使得该系统系统在模拟对话中实现了97.3% 的事实准确率。与 GPT-4相比,它明显优于所有基于检索和基于检索的基线,在头部、尾部和LLM最新知识方面分别高出3.9%、38.6% 和51.0%。与以前最先进的基于检索的聊天机器人相比,WikiChat的信息量和吸引力也明显更高,就像一个LLM。
在测试中,WikiChat 在与人类用户就最新话题进行对话时达到了97.9% 的事实准确率,比 GPT-4高55.0%,同时获得了更高的用户评分和更有利的评论。
通过WikiChat,我们有望有效应对大型语言模型的幻觉问题,使得这些模型在提供信息时更加可靠和准确。
项目网址:https://top.aibase.com/tool/wikichat
论文网址:https://arxiv.org/abs/2305.14292v2
苹果大模型MM1入场:参数达到300亿 超半数作者是华人
要点:苹果发布了多模态大型语言模型MM1,参数达到300亿,采用MoE架构,超半数作者为华人。MM1在模型架构、预训练数据选择和训练方法上进行了详细探讨,并在多项基准测试中表现出竞争力。MM1的预训练和监督微调结果显示,采用不同的数据和训练策略可以获得更好的性能,MoE模型进一步扩展了潜力。站长网2024-03-15 14:34:160000AI聊天机器人WikiChat:通过检索维基数据终结LLM幻觉 对话准确率比GPT-4高55%
**划重点:**1.🚀WikiChat通过维基百科检索数据,有效阻止大型语言模型的幻觉。2.🌐项目使用ColBERT进行信息检索,并通过七阶段流程确保响应准确。3.🌐WikiChat在与人类用户就最新话题进行对话时达到了97.9%的事实准确率,比GPT-4高55%站长网2024-01-09 11:32:240000日赚2千万!咪蒙“土味”短剧《我在八零年代···》爆火,原因是?
本文转载自运营公举小磊磊(公众号ID:gongjulei),免费阅读200万字新媒体运营知识,提升新媒体运营能力。2月22日,微博话题“咪蒙一个寒假靠2部短剧收入过亿”和“咪蒙出品我在八零年代当后妈”的阅读量均超7000万。这些话题及讨论一举将曾经的自媒体一姐“咪蒙”重新带回大家的视野,而这一次她的身份可以称得上是“短剧一姐”。1.《我在八零当后妈》走红,“土味短剧”的爆火逻辑是什么?站长网2024-02-29 14:25:520000马斯克:聊天机器人Grok将向X平台所有账户开放
今日,马斯克称,本周晚些时候,大模型Grok将向X社交媒体premium订阅用户全面开放。3月18日马斯克旗下xAI宣布开源Grok-1。据悉,Grok-1基础模型基于大量文本数据训练,共有3140亿参数。该模型使用基于JAX和Rust的自定义训练堆栈进行训练。站长网2024-04-01 22:46:040000雷军:小米15起步价一定会提高 把产品功能和体验做得更好
小米公司的CEO雷军近日在微博上公开了小米14系列的完整总结图,并呼吁广大网友提供关于下一代机型如何升级的建议。雷军在回复网友时明确表示:“起步价一定会提高。我们努力把产品功能和体验做得更好!”这意味着小米15系列的起步价可能会比前几代机型有所上涨。站长网2023-11-08 17:33:500001