大模型开源还是闭源好,周鸿祎与李彦宏针尖对麦芒
开源大模型还是闭源大模型,究竟谁才是“版本答案”?围绕这个问题,360创始人周鸿祎和百度创始人李彦宏最近就来了一次隔空论战。
先是在4月12日,有媒体曝光了李彦宏在百度内部的讲话。其中就有他认为闭源大模型在能力上会持续领先、而不是一时领先,并且开源大模型的运行模式和传统开源软件不同、不是众人拾柴火焰高,闭源是有真正的商业模式、并能够赚到钱,只有能赚到钱才能聚集算力和人才。
紧接着在4月16日举行的Create2024百度AI开发者大会上,李彦宏在演讲中就宣称,“开源模型会越来越落后”。
就两天后的第二十七届哈佛中国论坛上,自称开源信徒的周鸿祎站出来唱了反调,“我是一直相信开源的力量,至于说网上有些名人胡说八道,你们别被忽悠了。他说开源不如闭源好?连说这话的公司自己都是借助了开源的力量才成长到今天。”
其实在国内市场,大模型的开源、还是闭源并不是一个技术问题。无论闭源、还是开源,这一众大模型客观上的性能还逊色于海外的同类产品,它们也都不是在大模型技术层面的引领者。而单纯在技术层面,目前闭源大模型在能力上处于领先,诸如OpenAI的GPT-4、Anthropic的Claude-3、谷歌的Gemini Ultra就都是闭源,国内的情况也一样,百度的文心一言、阿里的通义千问、字节跳动的云雀、月之暗面的Kimi等叫得上号的大模型,也通通都是闭源。
周鸿祎认为,开源模型为整个社区提供了一个共享、协作和创新的平台,推动了技术的快速发展,开源社区聚集的工程师和科学家的数量是闭源的数百倍,所以今年开源大模型只做了一年,就已经超过了GPT-3.5的能力。然而实际情况远没有他所说的那般乐观,不管从模型能力层面、还是在产品落地的维度,事实是开源大模型还始终落后于闭源大模型。
尽管Meta方面刚刚发布的Llama3确实做到了性能优于GPT-3.5,可问题是谁都不会认为Llama3是开源社区的产物,毕竟其核心开发力量自始至终都来自Meta。
事实上,考虑到李彦宏和周鸿祎早已远离一线,所以两者关于大模型开源和闭源的观点相左,或许并不是对于技术路线的分歧。因此有观点认为,一方支持闭源、另一方相信开源的力量,其实更像是各自所代表商业利益的驱使。
周鸿祎支持开源模型的原因其实很简单,毕竟在如今的“百模大战”里,360智脑还处于追赶者的地位,在用户规模和对业界的影响力上都逊色于文心一言、通义千问等互联网巨头推出的大模型。
此前360方面在开源360智脑7B模型时就说得很清楚,“大家没必要重复造轮子”,言外之意就是AI创业者不用再自研了,直接使用开源360智脑的能力就好。纵观软件业的发展史,商业公司通过开源来获得某一赛道的领导权其实是非常经典的操作,比如谷歌就靠开源,让Chromium生态得以一统PC浏览器市场。
从某种意义上来说,周鸿祎的360开源自家大模型,其实是复刻Meta开源Llama的操作。既然自称是开源信徒的周鸿祎有私心,坚持闭源大模型更好的李彦宏,其实也有自己的小算盘。
李彦宏在对开源模型泼冷水的同时还表示,“大模型本身并不直接创造价值,基于大模型开发出来的AI应用才能满足真实的市场需求。这是我们百度根据过去一年的实践,踩了无数的坑,交了高昂的学费换来的。”
这句话的言外之意,就要联动他在一年前的公开发言了。在去年夏季的世界互联网大会数字文明尼山对话上,李彦宏在主题演讲中就曾表示,“新的国际竞争战略关键点,不是一个国家有多少个大模型,而是你的大模型上有多少原生的AI应用,这些应用在多大程度上提升了生产效率。”
在这不同时间的相似论述背后,其实是李彦宏想劝退大模型创业者,并希望他们直接加入百度的AI生态。而百度的底气,则来源于抢占了先发优势的文心一言,基于更大的算力、更多的数据和更强的算法,依托飞桨平台,从文心3.0、3.5,到4.0,文心大模型的能力也逐渐增强。
相比一年前,文心大模型的算法训练效率提升到了原来的5.1倍,周均训练有效率达到98.8%、推理性能提升了105倍,推理的成本更降到了原来的1%。

此前百度CTO王海峰就曾透露,目前文心一言累计用户规模已达2亿,日均调用量也达到了2亿;飞桨文心生态已聚集1295万开发者、服务24.4万家企事业单位,基于飞桨和文心创建89.5万个模型,利用千帆平台开发的AI原生应用数量更是超过了19万。
所以百度想要的其实是类似OpenAI那样建立AI生态,并以文心一言为支点进行平台化。如此一来,百度方面希望大模型赛道的参与者自然是越少越好,一旦创业者都去开发AI应用、而非大模型,自然就有可能会重演当年App Store的故事。
多年以来持续在AI领域投入的百度无疑是国内AI大模型的先行者,而其AI领域实现的增量收入也反映在了2023年的财报中,但绝对值却并不大。因此对于几乎错失了整个移动互联网时代的百度而言,夯实自家AI生态、并提升AI业务的货币化能力,无疑就是目前的头等大事。而相比于自己来做产品,做应用商店来“收税”显然会是个更好的选择。

归根结底,大模型到底是开源好、还是闭源更佳,目前在技术层面暂时还没有分出高下,但闭源或开源对于不同公司的商业利益却各有优劣。
研究显示:生成式人工智能对视觉效果和后期制作员工构成重大威胁
一项新的研究发现,生成式人工智能对视觉特效和其他后期制作工作的从业者构成了巨大的威胁。生成式人工智能正在摧毁好莱坞的就业机会,而且前景不容乐观。图源备注:图片由AI生成,图片授权服务商Midjourney一项对娱乐行业300位领导者进行的调查报告显示,四分之三的受访者表示,人工智能工具支持了他们公司的岗位消除、减少或合并。该研究估计,在未来三年内,将有近20.4万个职位受到不利影响。站长网2024-01-31 11:16:270000Inflection AI揭示新团队和计划,将情感AI嵌入商业机器人
划重点:-InflectionAI宣布了其新的高管团队,包括CEOSeanWhite、CTOVibhuMittal、COOTedShelton和产品负责人IanMcCarthy。-公司决定聚焦情感智能领域,打造能够适应和反映企业独特沟通需求的同理心聊天机器人。-InflectionAI已经在EQ方面进行了两年的研发,并具有在情感对话方面的先发优势。站长网2024-05-22 00:48:500000苹果或因欧盟反竞争行为面临超过5亿美元罚款
根据国外最新报道,欧盟监管机构正准备对苹果公司实施超过5亿美元的罚款,这是针对其在iPhone上限制AppleMusic竞争的行为。这一举动是基于比利时布鲁塞尔监管机构对Spotify的投诉调查,称苹果阻止应用程序向用户展示更为经济的替代品。站长网2024-02-19 10:06:160000阿里云与 Salesforce 合作 推出阿里云 Salesforce CRM 平台
阿里云与Salesforce合作,在阿里云上正式推出了SalesforceCRM平台。阿里云将提供本地化的签约、账单管理等服务,并集成阿里云的产品和解决方案,如AI等能力,为客户带来更全面的体验。目前已有十多家领军企业客户,如拜耳、百济神州和EF等,开始使用阿里云上的Salesforce。双方合作还将持续深化和扩大,推动国内云计算SaaS化市场的发展。站长网2024-01-12 17:35:270000联发科发布天玑 9200+ 移动平台 专为游戏手机而设计
联发科今天下午发布了全新的天玑9200旗舰芯片,专为游戏手机而设计。该芯片是在去年的高端芯片天玑9200的基础上进行升级,提升了性能和效率。图片截自MediaTek站长网2023-05-10 17:27:450000