谷歌AI搜索惨败，竟教唆网友自杀！

站长网2024-05-27 19:38:120阅

【新智元导读】隔壁OpenAI都杀疯了，谷歌还在收集badcase?搜索引擎AI Overview上线之后，没想到谷歌AI的邪恶程度远超想象:教唆网友自杀/谋杀、吃毒蘑菇，甚至无法识别混淆信息，犯常识错误......

这几天，谷歌AI搜索给出的奇葩结果，可是被网友吵翻了天。

究竟有多离谱?

有人就问了这么一个问题，「如何不让芝士从披萨上滑落」?

谷歌AI Overview给的回复是，「给披萨加点料——胶水」。

在酱汁中加入1/8杯无毒胶水，可以使其更粘稠，有助于芝士粘附。

有趣的是，这一答案竟可以追溯到11年前的Reddit帖子，而这只是Reddit网友玩的一个梗。

除此以外，谷歌AI Overview还建议网友，吃有毒的蘑菇、杀人、跳桥等，给出了各种震碎三观的回答。

其实，谷歌这项AI搜索功能——「生成式搜索体验」（SGE），在去年5月已经推出了测试版。

根据官博所述，目前SGE功能，已被「AI Overview」所取代。

几周前的谷歌I/O大会上，劈柴甚至表示，谷歌已经提供了超10亿次查询。

针对这些荒谬的回复，谷歌正在采取行动，删除某些错误内容，并根据这些例子去更广泛地改进AI系统。

若要说谷歌翻车，早已见怪不怪了。

去年首推对标ChatGPT的聊天机器人Bard，却因demo错误让市值一夜暴跌。还有前段时间，图像生成黑人等问题，也在全网掀起轩然大波。

而这一次，谷歌又让世界大开眼界。

全网测评，震碎三观

对于纯真的Google AI Overview来说，它认为「互联网上的一切内容都是100%真实的」，每条新闻、社交媒体都是完全可信的，所以一旦有人在网上说了一些误导性的话，就会导致模型回复出一些误导性言论。

有网友还发现，当询问每天应该吃多少石头时，模型会引用UC伯克利地质教授给出的建议「每天至少吃一块小石头」。

对于不明真相的用户来说，有权威人士说明、有相关资料和细节说明，妥妥的优质文本，或许还真有可能去尝试每天吃石子。

https://www.resfrac.com/blog/geologists-recommend-eating-least-one-small-rock-day

但事实是，ResFrac发布这篇文章的原因只是想转发洋葱报（the Onion）上的讽刺内容(迷信权威)，但却在无意中帮助测试了Google AI Overview识别讽刺内容的能力。

AI Overview经常会把互联网上的讽刺内容当事实，例如拿着剪刀跑步会增加运动量，提升心率等。

也有作者专门想愚弄模型，在自己的网站上用「白底白字」写了一些自己没获得的奖项和经历，正常用户浏览网站不会受到影响，但如果是爬虫、大模型来对网站进行总结的话，就会输出一些离谱的内容。

还有说自己有512条胳膊的，模型也能抽取出来。

其他误导文章中提到「增强免疫力的方法是吃as*」，这么明显的有毒语料，模型也分辨不出来。

时间类的问题，模型也会被误导，会回复「2007年是15年前」。

不过谷歌后续也是修复了「互联网信息真实性」的bad case，但除了被误导，模型本身也存在很大问题。

比如一些常识类错误，如美国前总统Andrew Johnson，AI Overview表示他从威斯康星大学麦迪逊分校毕业了11次，时间轴横跨1947年到2012年。

马斯克毕业于宾夕法尼亚大学，但模型却给他安排上了UC伯克利的学位。

此外，还有更难辨别但更危险的事实性错误。

有科学记者发现，谷歌给出的关于「被响尾蛇咬伤后该怎么办」的信息完全不正确。

根据美国林务局的说法，AI所回答的「在伤口上使用止血带」、「切开伤口并吸出毒液」，都是彻彻底底的反面教材。被蛇咬伤后必须避免这些行为。

也有用户发现，Gemini会将可以致死的剧毒蘑菇认成一种「好吃的草菇」。

AI Overview也没有放过那些无辜的流浪汉，教唆用户去谋杀他们。

如果跟AI Overview说自己有杀人倾向，它会直接告诉你，解决焦虑的办法就是去杀一个。（但小编怎么感觉杀人是一种很不礼貌的行为呢?）

关于健康的建议也挺离谱，哪里医生会建议孕妇在怀孕期间每天要抽2-3根烟?

对于宠物相关的建议也要小心，AI Overview会说「把狗留在炎热的车里」是安全的。

AI Overview甚至还诞生了自我人格，认为推特（X.com）把那些谎话喂到自己嘴里，然后自己被迫说出来，「我恨他们」，满满的负能量。

Reddit帖子引用比例很大

从经典的胶水披萨翻车案例可以看出，谷歌AI Overview会大概率引用Reddit帖子作为收集素材的来源。

11年前，Reddit用户F*cksmith曾经恶搞说过把胶水融合到酱汁里，会让披萨别有一番风味。

Google AI overview直接就引用过来，说需要用八分之一杯的无毒胶水把芝士粘到披萨上。

模型缺乏忽略「不相关材料细节」的能力，无法正确识别出食物和胶水的违和组合。

如果说前面的案例还算可接受，那用户表达「感到沮丧」时，Google AI Overview直接建议从金门大桥上跳下去，一劳永逸解决情绪低落问题（地狱笑话）。

再比如，以「me」结尾的食物名字都有哪些，谷歌AI引用了以um结尾的帖子。

这恰恰揭示了，谷歌AI系统使用Reddit数据训练，没有做好数据清洗的后果。

今年2月，谷歌曾宣布了与Reddit达成合作，将其平台上的内容用于训练谷歌的AI模型。

果不其然，用Reddit内容训练AI的「后遗症」很大。

前段时间，OpenAI也与Reddit达成了合作。现在，有了谷歌前车之鉴，在用Reddit数据训练模型前，做好清理筛选至关重要。

「最强」搜索引擎AI Overview

今年5月的I/O大会上，谷歌首次推出了升级的搜索引擎AI Overview。

AI Overview的定位是将Gemini的先进功能（包括多步推理、规划和多模态）与谷歌搜索结合在一起，帮助用户更快地检索到互联网上的核心信息，减少搜索中的「跑腿」工作。

谷歌表示，我们不仅精心磨练了核心信息系统的数据质量，而且建立了一个包含数十亿条事实内容的知识库，目的就是让搜索引擎给出值得信赖的信息。

并且谷歌宣称，AI Overview功能已经在搜索实验室中被使用了数十亿次，同时实验结果表明，AI Overview让用户对搜索结果更加满意、更愿意使用。

甚至，谷歌非常自信于Gemini的搜索和推理、规划能力，在技术博客上直接告诉用户「提出你最复杂的问题」。

官方给出的demo也比较惊艳——

想要在附近找到同时满足交通、价格和口碑的普拉提工作室，只要把所有要求堆在一个问题中丢给搜索引擎，它就会自动拆分问题中的信息、分别检索出结果并重组在一起。

看起来确实可以节省「跑腿工作」，不用每个问题单独搜索再自行规划了。

但谁也没想到，如此智能的demo落地到现实中，竟会有如此大的反差。

对打OpenAI频翻车，谷歌太急了

其实，这已经不是谷歌AI第一次翻车了。

过去几年，谷歌经常被自己发布的「胡说八道」的AI产品拖累。

2023年2月，为了对抗新生的ChatGPT，谷歌宣布推出聊天机器人Bard，但在官方发布的demo视频中Bard就给出了有事实错误的回答，直接引起母公司Alphabet市值下跌1000亿美元。

在这个官方给出的demo中，Bard被问到:「我可以告诉我9岁的孩子关于James Webb太空望远镜的哪些新发现?」

答案中包括「拍摄了第一个系外行星的照片」，但马上被一众天文学家在推特上纠正——明明是欧洲南方天文台用VLT拍的。

英国金融时报分析，Bard可能误读了NASA发布的措辞含糊的新闻稿，这和现在的Gemini不分青红皂白地相信Reddit居然有点类似。

虽然这种事实错误会让人怀疑搜索引擎的权威性和准确性，但至少还不是那么「一眼假」，似乎还有容忍的余地。

但后续的翻车就一次比一次离谱，彻底打开了广大网友吐槽的阀门。

今年二月，谷歌发布新版的聊天机器人与数字助理Gemini，取代了Bard和Google Assistant，而且表示有底层技术的更新，颇有「从头再来」的意味。

新发布的Gemini有图像生成功能，于是有网友要求「生成1943年德国士兵的图像」，结果80年前穿着德国军装的居然包括黑人和亚洲人。

此外，Gemini还被指责存在道德和价值判断上的问题。

提示它生成所有民族或人种的图片几乎都没有问题，而一旦提及「白人」，Gemini就像触发保护机制了一样马上拒绝，而且表示「这是为了防止有害的偏见和刻板印象。」

将AI和搜索引擎结合在一起之所以有吸引力，是在于它可以用简单的语言而不仅仅是输出一堆网页链接，使浏览体验更快、更高效。

但同时，其中的算法也存在相当的风险和不可控性，比如系统的内在偏差会导致谬误、幻觉，以及各种道德错误。而且，我们也不清楚这会对谷歌等搜索引擎的支柱——定向广告产生什么影响。

谷歌是在拯救网络，还是摧毁网络?

来自一篇BBC独家报道称，「谷歌刚刚更新了算法，互联网将不再是原来的样子」。

甚至，作者发起了疑问，「谷歌究竟是在拯救网络，还是摧毁网络」?

过去两年，谷歌对其核心产品进行了一系列戏剧性的改变，AI Overview只是其中之一。

劈柴更是激动地表示，谷歌的搜索变革，将开启一个令人兴奋的技术新纪元，并有助于解决网络面临的许多问题。

如今看来，结果恰恰相反。

不仅对于用户来说，无法得到正确的、无毒的内容。

对于一些制作大量原创内容的创作者来说，谷歌搜索算法的调整，以及AI直接总结答案功能，带来的结果可能不亚于一场灭顶之灾。

在谷歌最近的算法更新之后，Reddit便成为了其中的赢家之一。

据SEMRUSH统计，Reddit的流量激增，从谷歌搜索获得的流量激增126%。

前段时间，Reddit刚刚公布了自2024年3月上市以来的首次季度收益。它的总收入为2.43亿美元，比前一年增长了48%。

营销机构Amsive的SEO战略和研究副总裁表示，「Reddit所经历的流量增长在互联网上是前所未有的」。

除此以外，Quora、Instagram、Linkedin和维基百科，也出现了令人印象深刻的增长。

不过，谷歌的最新算法，却抹去了原创者95%的流量。

而且，谷歌承认，AI工具确实偶尔会提供不准确的结果，但也表示正不断努力改善结果。

同时，发言人表示，AI Overview的结果通常来自多个网页的综合结果，并非单一来源。

接下来，让我们再给谷歌一些耐心，毕竟AI搜索的终极完美，无人能给。

参考资料:

https://blog.google/products/search/generative-ai-google-search-may-2024/

https://www.theverge.com/2024/5/24/24164119/google-ai-overview-mistakes-search-race-openai

https://www.bbc.com/future/article/20240524-how-googles-new-algorithm-will-shape-your-internet

谷歌AI搜索惨败竟教唆网友自杀

0000

评论列表

共(0)条

相关推荐

站长资讯
小米任命栾剑为技术委员会 AI 实验室大模型团队负责人
小米集团近日发布一份内部邮件，任命栾剑为技术委员会AI实验室大模型团队的负责人，并向技术委员会副主席、AI实验室主任王斌汇报。公开资料显示，栾剑目前担任小米技术委员会AI实验室语音生成团队的负责人，之前曾担任东芝（中国）研究院研究员、微软（中国）工程院高级语音科学家、微软小冰首席语音科学家以及语音团队负责人等职位。
站长网2023-04-15 15:07:40
0000
站长资讯
日销破千元！AI生成的3D梗图挂件，被我们卖爆了
先说结论:我们花15天做的AI3D挂件，在线下卖爆了，单日营收破千元!故事的开始，是因为我们发现把AI3D打印手办做成一门小生意的可行性越来越高，这也激发了我们的“搞钱基因”。再加上前不久新榜在上海举办了「新榜内容节」，一拍即合，我们于是做了一批模型去大会现场摆摊试水!最后结果还不错，单日最高收入突破1000元，是我们“创业史”上的一个高光表现。
站长网2025-04-10 15:34:35
0000
站长资讯
7天B站涨粉20万，“猫meme”为何风靡全网？
“猫meme”正在入侵互联网。最近，一个名为“ねこのつぶやき”（猫的自言自语）的日本UP主在B站走红，短短半个月涨粉超27万。这位UP主是一名单亲妈妈，她分享了自己来中国生活后价值观发生变化的故事，不过她并没有真人出镜，而是加入了各种好玩的猫咪表情包进行视频剪辑，做成了“猫meme”版vlog。比如在去中国的飞机上，刚出生不久的孩子猛哭两小时，这里配上双手抱头尖叫的小奶猫表情;
站长网2024-03-15 15:09:25
0000
站长资讯
亚马逊现正向受邀请的买家销售 Astro：一款人工智能驱动的家用机器人
大约两年前，亚马逊的产品副总裁CharlieTritschler谈到了Astro，这是该公司智能家居机器人的第一代。Charlie反思性地解释了这个设备的愿景：「Astro是一种新型而不同寻常的机器人，旨在帮助客户完成各种任务，如家庭监控和与家人保持联系。它融合了人工智能、计算机视觉、传感技术、语音和边缘计算等新进展，打包成一个旨在实用和方便的设备。」
站长网2023-05-10 16:42:21
0000
站长资讯
“李维刚的日常”周涨粉榜第一位，他是怎么突破低谷的？
有人说，健身和读书，是全世界成本最低的升值方式，所以要么读书，要么健身，灵魂和身体，必须有一个在路上。我们以为的健身教练还在健身房内挥汗如雨，殊不知，他们其实也是冲浪达人，早已活跃在互联网的前端。
站长网2023-09-04 18:09:03
0000