字节紧急发布了一个警示
近一周,资本市场再度刮起AI大模型热潮,“豆包概念股”迎来普遍上涨。对此,字节十分罕见地出面回应。
12月19日晚,字节发布风险提示称,资本市场出现炒作“豆包概念股”现象,流传着众多夸大其词甚至是虚构的内容,涉及字节资本开支、数据中心花费、AI硬件、应用合作等多方面。“请投资者切勿轻信市场传言,以免遭受不必要的投资损失。”
资本热捧背后,字节用两年时间在AI大模型领域实现逆袭,打了一场漂亮的翻身仗。
1
亮剑
今年初,抖音CEO张楠辞职, 这位抖音核心骨干决定转战AI应用战场。经过一年的蛰伏,她带着最新产品即梦AI现身火山引擎Force冬季大会。
12月18日,如今已是剪映业务负责人的张楠公开表示,借助GenAI的技术,可以把每个人脑子里的奇思妙想快速视觉化,像做梦一样,这也是‘即梦’名字的由来。
作为字节旗下剪映业务的一个板块,即梦AI2024年5月上线,定位是AI内容平台,支持通过自然语言及图片输入,生成高质量的图像及视频,即梦AI还在业内首创了“一句话P图”“一键海报”和“动态海报”能力,大幅提升了图片中文字生成的准确率。
目前,创作者已经开始在即梦创作短片,今年7月,抖音上线了通过即梦创作的科幻短剧《觉醒》,这也是抖音上首部单日点赞破40万的AI短剧。
这只是字节重投AI的一个侧面。过去一年,字节一直在疯狂赶进度,从斥资购买GPU芯片到组建以Flow为核心的AI架构,再到从阿里等大厂高薪挖人,字节努力补齐此前因技术判断失误而拖慢的AI大模型进度。
如今看来,字节不仅推出包括多模态在内的豆包大模型家族,还通过降价等方式加速豆包大模型在应用端的使用。而随着应用不断深入,字节预计很快会展现出商业化方面的潜力。
会上,字节一口气晒出了最新成果,重头戏是豆包视觉理解模型的发布,这是一款具备内容识别、理解和推理、视觉描述和创作等能力的模型,标志着公司向多模态迈出关键一步。
与大模型同时发布的还有价格。谭待表示,视觉理解模型的定价模式依然基于Tokens,模型会把图像编码转成tokens,和文本tokens一同计费。
他进一步表示,“Claude是每千tokens2.1分钱,GPT-4o是每千Tokens1.7分钱,阿里千问是每千tokens2分钱。豆包视觉理解的定价是每千tokens3厘钱,比行业平均价格降低85%。”
豆包·通用模型pro也迎来升级,同时,字节还透露了多个垂直领域模型的进展。
火山引擎总裁谭待表示,12月通用模型pro完成了新版本的迭代,相比过去又有了大幅提升。“豆包pro已经全面对齐GPT-4o 能力,甚至在部分复杂场景复杂任务中,效果表现更好。而且使用价格只有GPT-4o 的八分之一。”
2
追赶
在经过两年多的发展后,AI大模型的发展重心已经从技术迭代向应用侧转移,这也是外界关注的焦点。
据谭待介绍,豆包大模型5月发布以来,日均调用量呈现高速增长。“5月模型日均tokens1200亿;到7月份涨到了5000亿,到9月份1.3万亿;而截至12月15日,豆包大模型的日均tokens数已经突破了4万亿,在7个月的时间里增长超过33倍。”
字节大模型正在加速行业渗透。谭待表示,大模型在各种场景中都在全面开花,尤其是和企业生产力相关的场景,比如信息处理场景,最近3个月豆包的调用量增长了39倍,在硬件终端场景,豆包增长了13倍。
有市场消息称,苹果正在和字节等多家公司洽谈,意在将后者的人工智能模型整合到中国版iPhone中,谈判仍处于早期阶段。对此,字节暂未回应。
一些细节也彰显了字节在应用方面的决心和力度。今年中秋,火山引擎一款给客户的玩具“显眼包”悄然走热,它主打聊天式情感陪伴,目前处于奇货可居状态,这也让字节内部颇感意外,可以确定的是,这个案例加快了字节AI在更多场景落地的速度。
华尔街见闻从知情人士处获悉,目前,找豆包合作的玩具公司特别多,将模型植入玩具可能会催生一波毛绒玩具潮。据观察,扣子这次联合苏珀尔、猫王音响、启明云端等在会场展示了相关产品Demo。
不过,随之而来的就是商业化问题,虽然字节并未明确提及商业化时间表,但从字节AI的应用方向上可以窥见一些端倪。
谭待表示,AI大模型市场还处于非常早期,能用的场景非常多,公司没有一个特定的偏好,因为AI将来一定是普惠的。根据豆包内部数据,工作、娱乐、生产力的场景差不多,大模型处于2C和2B齐头并进状态。
字节的优势在于,大模型技术处于快速迭代通道。谭待表示,作为一个后来者,字节的信心来自三个方面,一是市场非常大,二是火山有规模优势,三是公司在AI大模型这块的目标是第一。
挑战也显而易见,随着AI大模型竞赛进入深水区,字节AI首当其冲的就是成本压力。
在C端,豆包已经是用户数最多的AIGC应用。华尔街见闻获悉,张一鸣不仅亲自盯着豆包产品,还会提出反馈意见。根据QuestMobile数据,截至2024年10月,豆包APP月活跃用户为4839万。
民生证券计算机首席分析师吕伟表示,尽管字节AI产品的数据表现亮眼,月活跃用户数已突破7000万。随着“豆包”年底月活目标的达成,以及类似字节“即梦”AI视频等算力消耗大户的应用推广,算力需求将大幅增加。
今年,字节已经成为国内五大互联网巨头中采购AI卡及服务器最多的客户,明年采购量有望进一步攀升。谭待表示,火山方舟提供豆包大模型的 MaaS 推理服务,开发了新的模型之后,视觉理解模型会解锁更多的场景,从火山角度,算力储备是足够的。
快速增长的使用量叠加较低的价格,无疑会加剧成本压力。对此,谭待直言,ToB跟ToC不同,不存在先烧钱获取市场,后续再靠其他收费的商业模式,公司做了大量的成本优化,来维持可持续的商业模式。
C端方面,国内AI大模型产品仍未正式进入订阅付费阶段,豆包APP依然是免费应用,加之产品应用本身也需要做大量的推广,这也加剧了收入和成本之间的Gap。相较而言,Open AI已经给出了商业化目标,即2029年实现千亿收入。
挑战的另一方面来自竞争,虽然豆包在过去一年经历了快速逆袭,但AI大模型仍处于快速迭代中,对手们都在努力。
继Sora之后,谷歌刚刚发布了最新的视频生成模型 Veo2和图像生成模型 Imagen3;国内方面,智谱AI、爱诗科技、Minimax都在加码视频生成产品,尤其智谱AI和爱诗科技刚完成新一轮融资,将用在相关技术和应用上。
经过两年的追赶后,字节AI正在快速补齐能力,并以更自信的姿态朝着AGI演进。然而,这注定是一条很艰难的道路,字节要想在AI时代继续称王,还需背水一战。
VidChapters-7M:更全面的视频导航新工具
VidChapters-7M是一个拥有700万个用户制作章节标记的大型视频集合。这个新的数据集有助于创建和测试将视频分割成章节并为其命名的方法,从而使观众更容易找到他们想要的内容。VidChapters-7M的创建者希望这个工具能够改善目前视频导航的不足,让用户更轻松地找到感兴趣的内容。项目地址:https://antoyang.github.io/vidchapters.html站长网2023-10-27 22:14:530000淘宝直播上线“捧场购”,淘宝内容化战略进展如何了?
每逢大促,淘宝在内容化上的动作更加频繁。618前,部分商家店铺出现一个“内容首页”,这在淘系内部被称为“店号一体”。而在618期间,淘宝直播上线“捧场购”新功能,大力支持内容直播。内容化是淘宝近年来最重要的战略之一,在经历多个大促“大考”之后,淘宝的内容生态究竟如何了?淘宝直播打响声量战今年618,淘宝直播在提高市场声量方面更加努力。站长网2023-07-04 16:18:060002LeCun发文质疑LLM推理能力 大模型涌现离不开上下文学习
要点:LeCun认为,大语言模型(LLM)缺乏规划推理能力,其涌现能力主要源自上下文学习而非真正的推理。研究表明,针对复杂规划任务,如国际规划大赛中的问题,LLM的性能较差,其推理能力在特定领域受限,而涌现能力主要体现在简单任务和事先知道答案的情境中。站长网2023-11-24 18:05:530000支持百亿参数大模型、卢伟冰现场官宣小米首发,高通骁龙8s Gen3发布
高通又往中高端手机市场扔下一颗「重磅炸弹」。高通最强手机芯片骁龙8Gen3迎来了一款与它同源的「旗舰级」产品。3月18日,高通正式推出了第三代骁龙8s移动平台(骁龙8sGen3),凭借旗舰级的CPU、GPU和AI性能,全方位支持了强大的终端侧生成式AI功能、始终感知的ISP、超沉浸的移动游戏体验、突破性连接能力和无损高清音频。站长网2024-03-19 11:58:280000