知乎大模型“知海图AI”来了,要与GPT-4掰掰手腕
声明:本文来自微信公众号“三易生活”(ID:IT-3eLife),作者:三易菌,授权站长之家转载发布。
此前一直被看作是“ChatGPT概念股”的知乎,终于做出了自己的大模型。在日前举行的“2023知乎发现大会”上,知乎方面公开了与面壁智能共建的大模型产品“知海图AI”,而双方的合作则将以联合研发与战略投资的方式展开。据悉,目前该大模型的首个功能“热榜摘要”已启动内测,其将对知乎热榜上的问题回答进行抓取、整理和聚合,并把回答梗概展现给用户。
作为一个在toC内容平台上线的大语言模型项目,“知海图AI”是基于清华NLP实验室和面壁智能CPM-Bee(10B)模型的技术支撑。按照官方的说法,针对知乎热榜问题中的所有回答,在“热榜摘要”这个特定场景中将“知海图AI”大模型的效果与GPT-4进行比较发现,两个模型的表现几乎持平。
要知道,在王小川眼中,国内目前的大模型与GPT的差距是三年,即使乐观如李彦宏也只是喊出了,“百度的文心一言和OpenAI的差距是2个月”。而到了知乎这里,知海图AI就敢说与GPT-4在特定场景能战成平手了。
从某种意义上来说,知乎方面似乎是学习了手机厂商的“好榜样”,毕竟只要定语加的足够多,谁都能成为“第一”。在许多业内人士看来,对于知乎而言,将“知海图AI”的首秀放在知乎热榜是恰到好处的,毕竟要是去拼技术底蕴、拼应用范围,它可能不是百度文心一言、阿里通义千问的对手。
事实上,知乎入局大语言模型赛道,加入“百模大战”几乎是一种必然。如今在移动互联网红利近乎于枯竭的环境下,未来无疑是混沌的,因此抓住可能通往未来的船票就成为了互联网厂商拥抱变化的必然。用大语言模型来变革业务层、为具体的业务落地场景赋能,这也已经是诸多互联网厂商的共同策略。并且在当下这个存量市场中,在效率上的些许变化就已经能兑现为竞争优势。

当下做大语言模型已经不仅仅是追赶潮流,更是内容平台属性突出的知乎,保持市场竞争力的一种方式。无论老用户如何吐槽,知乎依旧还是目前国内互联网中数一数二的优质内容平台。君不见,微软集成了ChatGPT的New Bing在回答用户问题时,参考资料大量来源于知乎,由此也足以证明知乎的内容质量已经受到了海外科技巨头的认可。
要知道,ChatGPT这类大语言模型之所以比以往的人工智能产品更加智能,靠的就是“力大砖飞”,也需要海量的语料库做支撑,而语料库本身的质量更优秀、产出的结果也就会更好。有得天独厚的资源作为基础,知乎如果对大语言模型视而不见,未免就过于暴殄天物了。
反过来说,大语言模型其实也需要知乎的优质答主来帮助其实现迭代,让大语言模型的文本理解和上下文关联能力进一步升级。

众所周知,基于人类反馈的强化学习(RLHF)是ChatGPT得以爆发的秘密武器,虽然目前OpenAI还没有开源RLHF,外界只知道它是强化学习(RL)的一个扩展,是将人类的反馈纳入训练过程,为机器提供一种自然的、人性化的互动学习过程。
而ChatGPT自己给出的解释,就是与传统的RL相比,RLHF的优势在于能更好地与人类的意图保持一致,允许机器掌握明显嵌入人类经验中的决策要素,并从各种类型的反馈中进行学习,且根据需要对反馈进行整理。

所以人类的反馈无疑是ChatGPT智能化的关键,那么知乎能不能扮演这样的一个角色呢?答案显然是肯定的,因为知乎是基于“认知盈余”建立起来的问答社区。如果将AI生成的回答放到知乎上,让不同领域的专业用户来验证,就可以在反复调校中优化AI的性能。反过来讲,高质量的原创内容也更容易被AI发现,这有助于改变知乎在如今泥沙俱下的环境里、优质内容越来越难以被用户发现的困局。
至于为什么要将知海图AI的第一个应用场景聚焦在“热榜摘要”,知乎CEO周源在接受媒体采访时就表示,这是从早期产品“回答总结”中汲取的灵感。他表示,“那个功能(回答总结)是开放给所有用户,大家进行wiki一样的编辑,后来发现这个事情太困难了,回答数量多了以后成本非常高,而且效果并不好,现在则可以通过技术的方式,帮人来完成这样的事情。”

如果直接用大语言模型来进行创作,并回答知乎上的问题,结果几乎一定是灾难性的的。相信许多朋友在使用ChatGPT、文心一言,以及New Bing时就会发现,生成式人工智能有一个非常突出问题,那就是一本正经的胡说八道。但之所以用户知道ChatGPT在胡说,是因为在提问前你就已经对答案有了一个大概的认识,是有能力判断他所给出的结果正确与否。可如果用户对问题的答案没有概念呢?
知海图AI在热榜摘要上小试牛刀,可以说是知乎因地制宜来实现以点破面的方式,因为这个功能是面向内容消费者、而非生产者的。通过近似于“长话短说”的热榜摘要功能,用户不需要仔细浏览具体的回答,就可以大致了解大家围绕热榜话题进行了哪些评论,这对于以实时消息为主的知乎热榜而言,最大的好处就是将信息浓缩、以帮助用户提高效率。
在这个内容消费不断碎片化的时代,短视频的脱颖而出就已经证明了用户对于仔细“咀嚼”内容,以提炼信息这件事,是越来越没有耐心了。高质量的内容虽然是知乎的立身之本,但随着邀请制被废除,门槛降低后的大众化策略除了带来海量的用户外,也让知乎的大环境泥沙俱下,有价值的内容被发掘的难度越来越大。而有了热榜摘要,用AI来帮助用户发掘优质内容,自然也就能盘活资源。
不过对于创作者来说,热榜摘要可能并非一个福音。将热榜问题的回答去粗取精、再整理到用户面前,尽管满足了用户无障碍获取信息的痛点,但代价是用户既然已经看完了精华,还会不会去继续查看具体的回答呢。所以结果会是做出了优质回答的答主可能不会被用户发现并关注,这也就代表着属于优质答主的流量无形中会变少。
顺着这一思路再发散一下会发现,既然用户寻找答案的工作被AI代替,也就意味着热榜摘要有减少用户使用时长的风险。在其他APP都在想方设法让用户留下的情况下,知乎这无疑是反其道而行之。并且对于一个依赖广告和商业化内容解决方案的平台而言,用户停留时间短几乎就等于流量变差,所以这似乎并非一个好的结果。
日本拟设置「AI 战略会议」:着眼于人工智能潜力和风险推进举措
据共同社消息,日本首相岸田文雄5月9日透露了方针,拟设置磋商制定利用人工智能(AI)相关规则等的「AI战略会议」。当天在官邸与研究人员和创业人才等开会时,岸田文雄称「会着眼于AI的潜力和风险推进举措,速度感将是关键」。据报道,战略会议将由技术人员等专家和相关部门的负责人参加。据称,战略会议将思考在教育现场的利用方法、与著作权的关系,并探讨关于AI的国家战略。站长网2023-05-10 10:54:010000网易游戏发布未成年暑期限玩通知:游戏总时长不超过24小时
网易游戏官方今日正式宣布,为确保未成年人在暑假期间能够合理安排学习与娱乐时间,特别制定了暑期游戏时间限制政策。根据新规,未成年玩家将仅能在每周五、周六、周日的晚上20点至21点期间登录游戏,整个假期内的游戏总时长严格控制在不超过24小时。这一举措彰显了网易对未成年人健康成长的深切关怀与责任担当。站长网2024-07-03 15:41:1400013倍光学品质级变焦!荣耀X50搭载1亿像素主摄:支持像素九合一
快科技7月5日消息,荣耀今晚正式发布了荣耀X系列十年登峰之作荣耀X50。据介绍,荣耀X50后置1亿大像素超清主摄,1/1.67英寸大底传感器,f/1.75大光圈,在高像素模式下,可支持1亿全像素拍摄,获得更多画面细节,放大后依然清晰。在普通拍摄模式下,新机凭借九像素合一等效像素尺寸为1.92m,以此获得更大的进光量,在暗光场景中带来更清晰的成像效果。站长网2023-07-06 05:18:280006雷军兑现承诺直播时打开礼物功能:网友疯狂刷屏送礼
快科技5月18日消息,早上8:30,雷军如约再次进行了线上直播,此次他亲自驾驶一台小米SU7Pro,由上海世纪大道附近开往杭州,途中展示了小米城市领航NOA功能,此次也是小米SU7Pro首次公开亮相。值得一提的是,雷军在上次直播时并没有打开礼物功能、也没有进行带货,被当时的网友吐槽”说浪费了泼天的流量”。站长网2024-05-18 10:08:170000谷歌Gemini被曝视频造假!多模态视频竟是剪辑配音,击败GPT-4靠「作弊」?
【新智元导读】才一天,谷歌Gemini被质疑造假、夸大宣传的议论声淹没了。多模态视频是剪辑拼贴的,打败GPT-4靠的是CoT@32,AlphaGo也并未结合进Gemini中。谷歌这波公关,属实是着急了。谷歌的宣传视频,竟然作假了?在谷歌昨天发布的Gemini的宣传视频中,所有人都被那一段6分钟一镜到底的互动视频惊艳到了。0000