沸沸扬扬的搜索AI,能颠覆传统搜索引擎吗?
现阶段的搜索AI,暂时还干不掉传统搜索引擎。
在传统搜索引擎的时代,想要找到某个问题的答案,你会怎么做?
也许你会打开你的浏览器,输入问题,然后点击搜索按钮。然后,你会看到一大堆的网页链接。
但除了某些十分简单、很显而易见的问题外,只要是稍微复杂些的,需要提炼的知识,人们往往都难以直接从搜索页面中获取答案。

于是,你不得不花费时间和精力去筛选和阅读这些网页,并不断点击“下一页”,才能找到你想要的信息。
也正因如此,在生成式AI的浪潮下,如微软的新必应、谷歌的bard、Perplexit AI推出的会话搜索引擎,都在试图解决人们的这一痛点。

而最近,这股AI搜索引擎的大战,也席卷到了国内。
几天前,昆仑万维推出了基于自身“天工”大模型的AI产品——天工AI搜索。可以说,这是目前第一款落地,并投入应用的独立AI搜索产品了。

该搜索AI一出,即刻在国内掀起了不小波澜,一些科技媒体纷纷盛赞,称其会“革了传统搜索引擎的命!”
那么,在表面的喧嚣之下,天工AI搜索,及其类似的一票AI搜索引擎,真正的现状究竟如何?
1
实际表现
鉴于到目前为止,关于天工AI搜索的测评,已着实不少了。因此,本篇文章不打算再重复测试某些千篇一律、无关痛痒的功能,而是打算针对大部分普通用户,在实际使用中最可能遇到的重点问题进行测评。
在这些重点中,最为人关切的,首先就是幻觉问题。
为了测试这点,我们分别将天工AI搜索与新必应进行了对比。


可以看到,在部分问题上,天工AI搜索与新必应都给出了较为准确的回答,没有出现幻觉/错误的情况。
但可以明显感到的是,天工AI搜索的答案比新必应要简略了许多。


例如,在“谷歌今年推出了哪些AI产品”这一问题下,天工AI只是笼统地提到了PaLM2这一产品。
而这很可能是天工AI的向量语义检索导致的。
这种检索方式的好处,是只需要计算向量之间的距离或相似度,而不需要对每个文本进行复杂的分析和处理。

在新必应的精确模式下,AI的回应也很简略
通过对问题和潜在相关文档进行编码,并计算它们之间的相似度,天工AI就能有效地过滤掉无关或低质量的信息,只保留最相关和最有价值的信息。
但这样一来,生成的内容就会变得十分简略。
可即便采用了向量语义检索,也难以完全避免幻觉问题。

在这个回答中,天工AI犯了一个明显的错误。众所周知,在目前OpenAI的计划中,GPT-4是不开源的。
而同样的,类似的错误与幻觉也出现在了新必应中。

从理论上来说,如果搜索AI能够从网络上爬取到所有的信息,并且能够完美地理解和处理这些信息,那么它就不会产生幻觉或错误。但是,这在实际中是很难实现的。
至于具体的原因,暂时先留到文章第二部分解释。
在这里,我们先看看另一大使用搜索AI时的重点:理解和分析能力。

从功能上来说,AI搜索这个新物种,之所以被人们寄予了厚望,是因为自从其诞生的那天起,人们就不单单只想将其作为一个纯粹的搜索工具,而是希望它成为一个能集知识的发现、处理、分析和重新组织为一身的个人智能助理。
毕竟,在这个信息密度倍增的时代,人们已经越来越不满足于接收那些未经“咀嚼”和“消化”的原始信息了。

那么在这方面,天工AI搜索表现得怎样呢?
我们可以用几个比较考验分析和理解能力的问题对其进行测试。

从这个回答,可以看出天工AI仍然保持了十分严谨的风格,对“核污水是否会变核污“雨”没有给出一个轻率的结论。
然而,这样的回答,仍然停留在了一个“知其然”的层面,在对某些复杂问题进行询问时,人们更渴望搜索AI展现出更智能、更具主观能动性的一面。

在这个问题上,新必应的回答,则显得详细和深入得多。
而要想实现这样的回答,就不能仅仅只对网页中的信息、数据进行简单的搜集,而是要依靠AI自身的智能,对其进行提炼、分析和理解。
而这样的智能,在面对一些需要选择和比较的问题时,就显得尤为重要。


在某种程度上,AI搜索引擎迈向智能助理的第一步,就是对问题形成自己的“看法”。
只有这样经过深度处理后的信息,才能更有效地帮助人们进行思考、决策。
而这样具有“主动性”的特点,正是新一代AI搜索引擎区别于传统搜索引擎最本质的区别。
2
人工智能VS传统搜索
有了AI加成的搜索引擎,究竟能否战胜传统的搜索方式?
自从今年新必应问世以来,这就是一个备受关注的话题,然而,最终的数据却无情地表明了:现阶段的搜索AI,暂时还干不掉传统搜索引擎。
分析公司StatCounter的数据显示,今年7月份,必应在全球的市场份额为3%。这一份额与今年1月(新必应推出前一个月)的基本相同。
分析公司Similarweb的另一份报告显示,7月份必应的月访问量约为谷歌的1%,也与1月份大致相同。

全球搜索引擎市场份额,来源:StatCounter
尽管这样的数据,并没有对所有直接访问必应聊天页面的人进行统计,但它仍印证了传统搜索引擎的地位。
这样的现实,说明了在新式的搜索AI推出许久之后,人们仍然不愿舍弃传统搜索方式。
而这背后的原因,其实也很简单:可靠性。
对很多人来说,用谷歌、百度搜索,虽然麻烦一点,但找到的内容足以让自己的材料有足够高的可信度。
而如果使用AI搜索,哪怕所有的答案中,只有5%是幻觉和错误,就足以让人在进行决策和判断时翻车。
并且从技术环节上来说,联网功能也并非根除幻觉的“灵丹妙药”。
这主要是因为,网络上的信息包含了很多噪声,这些噪声往往是一些不完整、不一致、不可靠的信息。

而搜索AI在识别和过滤噪声方面的限制,是由多个技术环节共同造成的,这其中包括了网页抓取、索引构建、链接分析等。而从这些噪音中,提取出有价值和意义的信息却绝非易事。
因为在这一过程中,链接的稀疏性、不均匀性,网页的多样化,都有可能影响搜索AI判断,导致噪声的干扰。
既然如此,那这是否意味着,搜索AI始终无法撼动传统搜索引擎的地位呢?
其实不然,因为一项新技术的前景,有时不在于其在原有赛道表现如何,而在于其是否能开辟新的赛道。
如上一部分所述,在这个信息密度倍增的时代,未经处理的原始信息,已经很难满足人们的认知需求。
换句话说,在这个时代,人们想要的不仅是信息、知识,而是智慧。
在目前新必应等搜索AI的应用场景中,最有价值,也最不可或缺的部分,就是其对某些晦涩、艰深内容的解读。
有时候,只要使用了正确的提示词,搜索AI就能将信息中难以理解的部分,转化为简明易懂的内容,
而这无疑大大地降低了个人的认知和理解成本。

从这个角度上说,搜索AI有着传统搜索引擎无法取代的意义。
因为其不仅仅是简单地将信息摆在人们面前,并且还提供了一种见解、思路和策略,而这正是真正的个人智能助理所必备的特质。
正如现在的某些浏览器,都会自带“翻译插件”,方便人们在浏览外文网站时,能够高效率地理解其中的内容一样,或许在未来,搜索AI也会以类似的形式,在人们阅读网页时,一边进行总结,一边提供思路,见解。

到了那时,人们甚至能要求其对网页中的具体的某段文字,进行分析和总结。
3
未来的搜索引擎
按照上面的思路,未来的搜索引擎,也许将是结合了传统搜索与AI搜索二者优势的产物。
其最有可能的技术思路,则很可能类似于当下的AI智能体。
具体来说,在获取信息时,搜索AI可以先借助传统搜索引擎,爬取大量网页,之后将这些庞大的,未经处理的信息,交由一位智能体专门进行筛选、提炼。
之后,这些经过提炼后的信息,会交由一个负责审核和纠错的智能体,以核验信息的准确性。
当确认无误后,这些信息最终将交由负责整理和输出的智能体,并通过其分析、推理能力,为人们提供有价值的思路、建议。
实际上,这样的技术路线,在现实中并不遥远,并且已经被某些团队投入了使用。
例如,最近一个由哥大研究人员开发,名为GPT Researcher的AI智能体项目,已经能独立完成各种类型的网络科研任务。
其主要原理是运行「规划者」和「执行者」智能体。

其中规划者生成研究问题,并提出针对该问题的一系列大纲、要领。
之后,执行者会针对大纲中的每个子问题,汇总20多个网络来源,形成客观、真实的结论。
这样的解决方案,避免了以往的AI 联网搜索时,因为获取的资源有限,以及内容的无规划性,可能导致肤浅的结论或带有幻觉的答案。

在可以预见的将来,倘若类似的技术,用在了AI搜索上,那么人们就可以既能借助传统搜索引擎的准确性,以及AI搜索的智能分析能力,极大地降低个人的认知成本,并以此将其作为每个人都能拥有智能个人助理。
安卓一年一迭代谷歌也累了:开始挤牙膏更新
快科技5月14日讯,本周开幕的谷歌I/O开发者大会上,Android14仅仅占了非常小的讲解篇幅,画风突变让外界很不适应。对此,谷歌Android生态副总裁SameerSamat表示,这并非发布会事故”。Android已经按照一年一更的节奏迭代,这一次我们想从用户体验而非系统的角度来展示更新内容,同时,更多新特性会在持续更新中逐渐抵达。站长网2023-05-14 19:48:330000腾讯混元将发布大模型C端App腾讯元宝:超万亿参数规模
在腾讯云生成式AI产业应用峰会上,腾讯表示,将于5月30日正式发布面向C端的全新App——“腾讯元宝”。这款应用的背后,是腾讯全链路自研的通用大语言模型——混元大模型,它以其超过万亿的参数规模,展现了卓越的中文理解与创作能力、逻辑推理能力以及可靠的任务执行能力。站长网2024-05-17 14:09:360000FF:将向歌手Chris Brown交付FF91 2.0 Futurist Alliance
就在刚刚,FF(FaradayFuture)宣布,全球顶尖音乐传奇和企业家ChrisBrown将成为下一任FF912.0FuturistAlliance车主和开发者共创官,并将在此后的“交付共创日”上接收他的车辆。Brown先生在他洛杉矶的家中招待了FF的创始人兼首席产品及用户生态官贾跃亭先生,他们讨论了FF912.0的卖点和亮点,并正式开始了共创。站长网2023-10-10 11:42:240000ChatGPT 可能会阻碍网络安全行业
ChatGPT因其惊人的人类化和准确的回应而备受关注。尽管其受欢迎程度不断增长,当前网络安全行业也更为关注这种技术是否有助于使互联网更安全或被那些试图制造混乱的人利用。ChatGPT带来的威胁ChatGPT作为人工智能聊天机器人,具备高级数据分析、自动化重复任务和计算风险评分等网络安全用例。然而,ChatGPT的易用性和广泛可用性也会使黑客能够入侵软件并发展出高级网络钓鱼工具。站长网2023-04-24 11:08:080000iQOO12系列手机11月7日发布 首批搭载骁龙8Gen3
iQOO宣布将于11月7日发布iQOO12系列手机,该系列将首批搭载骁龙8Gen3平台。根据此前消息,iQOO12系列将采用居中单孔直/曲屏双方案,不再使用塑料屏幕支架,后置相机Deco采用圆角三摄,直立长焦换成潜望式长焦,支持120W快充。站长网2023-10-26 10:40:100001