大厂大模型,强在哪?
今年以来,中国科技公司掀起“百模大战”,大厂、创业公司都发布了自己的AI大模型。
大模型越来越多,有闭源有开源,有通用也有垂直;企业做大模型的策略也不尽相同,有的坚持从底座做起,有的在开源架构之上抄近道。
不过,虽然路径有差异,但有一点逐渐成为行业共识——大模型要落地,得从产业开始。B端的使用效果,成为评价一个大模型靠不靠谱的重要指标。
做出一个大模型不难,难的是让大模型具备产业价值,在应用的时候稳定、安全、易用。
对于To B企业而言,面对如此众多的大模型产品,该如何选择?
1、从“玩具”到“工具”,落地才是王道
短短半年时间,大模型创业就经历了共识之变。
年初,很多人认为,通用大模型是未来。大家看到GPT3.5大模型强大的泛化能力,感到非常兴奋,认为大模型似乎可以解决一切问题。
这里简单科普一下,大模型分为两类,一类是通用大模型,可以聊天、问答、通用数理计算等,另一类是垂直大模型或行业大模型,面向产业,突出应用,强调降本增效的作用。
有创业公司基于开源的大模型,快速做出了一些有意思的产品,AI绘画、AI写作、AI数字人等火爆。
然而没过多久大家发现,做出类似产品的门槛不高。受制于算力的稀缺性,很难将大模型包装成类似微信这种大范围使用的付费C端产品。而大模型训练的成本很高,部分参数量很大的大模型,训练一次动辄耗资数千万。
盲目烧钱不可持续,如何让大模型在产业里发挥作用,产生价值,成为很多大厂考虑的问题。
百度就发现,文心一言发布后,一开始来交流的企业都是CEO级别的人出面,后来大多是技术负责人或业务负责人。字节跳动发现,来找火山引擎的企业,四五月份都是模型厂商,需求是训练模型,现在是一些行业客户,希望在营销、客服等场景落地。
从玩具到工具,落地才是王道。所以我们看到,近期国内科技公司新发布的大模型,大多都面向垂类产业落地。而垂直行业里的企业们,都有很强的降本增效的需求。
这导致一个结果,全球的基础大模型,现阶段都主要面向To B行业市场。
2、大模型落地,拼什么?
To B客户在选择大模型产品时,应该重点考察哪些方面?
首先,有没有“云”很重要。
这波AI2.0浪潮,很多能力都是建立在云平台之上。通过云平台输出模型能力,支撑更多应用生长,是一套比较高级的打法。
大模型离不开云厂商。国内现在跑的最快的大模型公司,如百度、阿里,都有自己的云业务。而在它们公司内部,云部门也是冲在最前面。
这是大厂跟创业公司非常大的一个区别,即便是OpenAI,也要借助微软云平台Azure。而微软也借此实现了对OpenAI更强的控制,成为其独家云厂商。
一些在算法上实力不弱的创业公司,也许能在很短时间内,基于开源代码开发出自己的大模型,但它们没有自己的云底座,必须得找云厂商合作,后期在系统部署、数据归属、利益分成方面,难免存在隐患。
其次,要看有没有“生态”。
大模型创业的生态分为四层——芯片层、框架层、模型层、应用层。其中芯片层 框架层是基础设施,企业的进入门槛最高;模型层对算力、算法、数据、人才的要求非常高;应用层是基于前两类大模型,调用API开发应用。
所有的玩家都要在这四大层级里站位,纵向覆盖的层级越多,竞争壁垒越深厚。
中国的科技公司在布局时,尤其是BAT这样的超级巨头,往往会交叉覆盖四大层级。基础打法是先发布通用大模型或者行业大模型底座,其他公司再基于这些基础模型,结合自身拥有的行业数据,微调出自己的大模型应用。
最后,服务体验也不能忽视。
企业客户在选择大模型时,不能只看中技术实力,是否懂行,能否保证交付,运维有没有长期保障,同等重要。
以上这三个方面,将决定哪些公司的大模型产品,更能获得客户青睐。
3、大厂或最有可能胜出
综合来看,大厂的优势明显。
业界普遍认为,百度、阿里、华为是综合实力排名靠前的玩家。
就像当年的云计算市场一样,底层算力和平台能力可以构建壁垒,市场需要算力强悍、模型全面的服务商。那些在算力、平台、模型、应用方面都有布局的大厂,对企业客户具备更强吸引力。
百度、华为,除了自研大模型产品,还完成了从芯片到应用的布局。百度是“昆仑芯 飞桨平台 文心大模型”,华为是“昇腾芯片 MindSpore框架 盘古大模型”,这是其他公司在短期内很难追上的优势。
也是基于这些优势,大厂一方面在技术上做到了领先,另一方面在服务客户上更接地气。
比如百度,百度是国内第一个推出类ChatGPT产品,开放内测,硬刚ChatGPT的公司。在SuperCLUE中文大模型7月最新榜单中,百度的大语言模型产品文心一言,以62分的总成绩超过了GPT-3.5-turbo和ChatGLM-130B。IDC最新发布的《AI大模型技术能力评估报告,2023》中,百度文心大模型3.5拿下12项指标中的7个满分,综合评分第一。
现在,国内的大模型厂商,都在积极拓展ToB业务。百度的文心千帆,是全球首个一站式企业级大模型平台,可以为企业提供从数据处理、模型训练、模型部署到模型运维等全流程的大模型服务。
因为有完善的工具链,配套更丰富,文心千帆在为客户提供服务时,能更全面、更易用、更安全。这大大降低了企业开发大模型的门槛,基本接近“开箱即用”的效果。
抛开这些硬实力,在软实力方面,大厂的优势也很明显。无论是资金储备、人才厚度,还是产业洞察、数据积累,都非创业公司所能比。大厂过去十几年的经验,在持续构建竞争壁垒。
尤其是在垂直行业资源方面,大厂布局很深。百度一口气推出十多个行业大模型,华为推出矿山大模型、实时预测全球海浪的大模型,以及京东面向零售、金融、城市、健康和物流领域提供行业解决方案,都体现出大厂已经在“用大模型赋能千行百业”。
这场AI大模型的长跑,不同背景的玩家,并不是站在同一个起跑线上。
具备资金储备、生态能力、产业洞察、战略意志的实力玩家,最有可能率先到达终点。
网易如何用AI改造游戏
《逆水寒》手游公测两周,各式话题不断,但最受关注的话题,几乎都指向了AI在游戏中的应用。点开抖音上的《逆水寒》手游相关视频,可以看到花样百出的捏脸成果,与NPC的离奇互动,评论区的各种偶遇对话。虽然游戏的机制并未脱离MMORPG的范畴,但在AI加持下,看起来玩家真的收获了千人千面的游戏体验。AI与游戏的结合由来已久。站长网2023-07-15 22:22:270000无需文本标注,TF-T2V把AI量产视频的成本打下来了!华科阿里等联合打造
在过去短短两年内,随着诸如LAION-5B等大规模图文数据集的开放,StableDiffusion、DALL-E2、ControlNet、Composer,效果惊人的图片生成方法层出不穷。图片生成领域可谓狂飙突进。0000ChatGPT、Claude等聚合平台Poe,获7500万美元融资
1月11日,生成式AI聊天助手聚合平台Poe,获得7500万美元(约5.3亿美元),估值5亿美元(约35.8亿元)。本次由AndreessenHorowitz、a16z等投资。0000Media2Face:支持语音等多模态引导生成3D面部动态表情
划重点:1.🧠引入广义神经参数化面部资产(GNPFA),通过高度概括的表达潜在空间解耦表情和身份。2.🌈创造M2F-D数据集,包含大量共语3D面部动画,具备情感和风格标签。3.🚀提出Media2Face,基于GNPFA潜在空间的扩散模型,接受来自音频、文本和图像的多模态引导,拓展了3D面部动画的表现力和风格适应性。站长网2024-02-01 15:16:200002网信办:6月下旬以来下架324个诱导未成年人不良行为违规App
国家网信办发布了“清朗·2023年暑期未成年人网络环境整治”专项行动曝光第一批典型处置案例。国家网信办表示,6月下旬以来,网信部门深入开展“清朗·2023年暑期未成年人网络环境整治”专项行动,聚焦未成年人较为活跃的网站平台、产品功能和位置版块,及时发现处置危害未成年人身心健康的突出问题,有力遏制一些乱象隐形变异、反弹反复,为未成年人营造健康向上的网络环境。现将部分典型案例通报如下:站长网2023-08-29 15:23:260000