“百模大战”未分胜负,自研大模型的美图已经赚到钱了
自从ChatGPT掀起AI大模型浪潮以来,国内科技巨头们一路狂奔,“百模大战”迅速打响。
不过风口之上,行业整体呈现出“雷声大雨点小、看得多用的少”的状态——绝大多数公司仍在大手笔投入做研发、训练和测试,如何落地、怎么商业化这些问题还没有什么清晰准确的答案。而还有不少公司是投机主义,更多还停留在讲概念、追热点的阶段。
AI离我们究竟是近是远?大模型什么时候走出实验室、走入真实的产品中?现在有没有能通过大模型而真正获得增长的公司?
在这诸多问题面前,美图给出一个看起来不错的答案。
8月28日,美图交出了发布自研大模型后的首份成绩单:2023年上半年,美图公司实现总收入12.61亿元,同比增长29.8%;根据国际财务报告准则(IFRS)之归属于母公司权益持有人的净利润为2.28亿元,同比扭亏为盈。经调整后归属于母公司权益持有人净利润1.51亿元,同比大增320.4%。在AIGC推动下,VIP会员数超720万,也创下了历史新高。
资本向来最为“灵敏”。受益于业绩利好,今日美图股价大幅走强,已涨超20%,成为互联网服务板块涨幅最高的个股,亮眼成绩赢得了市场积极反馈。
美图股价走势图源:富途
今年抓住AI大模型这一机遇后,资本市场对于美图的态度非常明朗,公司股价整体持续高涨,与去年同期相比,美图的总市值涨幅近4倍。一句话解释就是,在全球AI大模型商业化进展都比较慢的大背景下,美图已经能靠大模型实现规模盈利了。
自研视觉大模型,
“资源飞轮”推动成长加速
在解读美图怎么靠AI大模型赚钱之前,我们有必要先了解美图具体在做什么、真实水平如何。
目前市场中正在做“AI大模型”的,有各大互联网大厂、科技公司,还有通讯公司和高校及科研机构;在大模型中,有很多行业熟知的,比如百度的文心一言、腾讯的HunYuan、阿里的通义大模型、华为的盘古大模型、科大讯飞的星火、中国移动的九天大模型等等。
事实上这些大模型大部分是一个“系列”而非单个,其中包括NLP、多模态大模型、生命计算大模型、视觉大模型等多个类型。虽然在ChatGPT的影响下早期大家都更关注语言大模型,但事实上,其他类型的大模型也已逐步走上主舞台。
比如“视觉大模型”就是一个典型案例,现阶段海外的Adobe、Meta以及国内大厂都在陆续发布,美图自研的MiracleVision也正是。
了解AI大模型的人都清楚,数据、算法和算力是大模型的三要素,这也是一个评价大模型的基础“标尺”。
对标来看美图,通过与头部云服务厂建立合作,美图先解决了图像处理参数量越大、对算力资源要求越高的问题。这其实也是目前很多大模型共同的选择,无需过多赘述。真正值得关注的是,其实数据和算力有什么优势,在这两方面MiracleVision有备而来:
数据方面,美图MiracleVision拥有一个能助推其成长加速的“资源飞轮”。
简单理解,AI大模型不断为用户提供服务,然后用户不断为模型生成新的内容需求方向,用来调教和优化模型,这就形成了一个良性的闭环。比如ChatGPT就是用一个聊天界面,让大模型直接触达了用户偏好。
再看美图,截至今年6月,美图的月活用户数已经达到了2.47亿,同比增长2.5%,在存量竞争的大环境下,美图甚至还连续三个半年保持了增长态势。而且从QuestMobile发布的报告数据来看,今年上半年,美图旗下的产品美图秀秀和美颜相机还分别蝉联了中国图片美化赛道、中国拍照摄影赛道用户规模的第一名。也就是说有超2亿的、真实使用美图旗下产品的用户,正在源源不断输出个性化的审美偏好,让美图的大模型加速学习和成长。
算法方面,美图也早有行动。
据官方介绍,2010年时美图就创立了MT Lab来发展跟计算机视觉、云计算等算法相关的技术;自2013年开始,美图重点投入深度学习。截至目前,美图MT Lab在ACM MM2023等国际顶级会议上已累计发表数十篇学术论文, 还有数百种注册专利,可以说科研“含金量”是有保证的。
财报数据也能佐证美图的投入力度——今年上半年,美图的研发投入达2.94亿元,同比增长10.8%,拉长时间来看,已连续三个半年持续增长。
当然,如果只看基础三要素,对于视觉大模型的讨论就局限在了基础技术层面,我们仍很难看出一家科技公司对于策略和行动布局的思考。
仔细来看MiracleVision的介绍,你会发现美图赋予了自家大模型一个很特别的定位——“懂美学”。
乍一看这是个很“主观”的描述,但它讲出了一个简单道理:技术总是要为人类提供服务、满足人类的需求,只有让AI不断学习去理解和接近人类审美,才能更好地拿来应用。
美图官方介绍:MiracleVision擅长于“亚洲人像摄影”、“国潮国风”、“商业设计”等生成方向。这是最好的例证。
值得关注的是,看起来“主观”的要求,其实也有客观的方式去达成。美图去找到更多专业人士来持续辅助和调教大模型,从三方面发力使其掌握更前沿、主流的审美趋势。其一是邀请艺术家、设计师等专业人士参与到视觉大模型中,研究美学趋势研究。其二是基于机器学习的美学评估系统,持续优化生成结果。其三,美图还不忘与更多懂美学的创作者一起共建生态,源源不断地补充作品用于大模型优化。
除了“懂美学”,美图的MiracleVision还有一个值得关注的重点:从视觉创作场景来反推技术演化。
这一点其实让MiracleVision与市面上绝大多数AI大模型都有了明显差别。
通常,大家都是先做AI大模型的研发而后再去想怎么落地,特别是巨头们都在做一整个系列的通用大模型,几乎都是一种先全覆盖、再找垂直切口的思路。但此时问题就出现了:虽然任何产业都能用AI大模型提效,但不同产业千差万别,细节处更是纷繁复杂。所以在落地时,就如周鸿祎所说“很多大模型其实没办法满足行业和企业的场景垂直性、专业性的要求”。
美图的MiracleVision与之不同,可以挖掘视觉创作中最适合与AI协作的场景,比如绘画、设计、影视等,先去洞察、发现这些创作场景下有何痛点难点,而后再反推技术演进去针对性地解决。
从去年年底开始,美图平均每个月都会推出一个新功能,比如AI动漫、AI简笔画、AI写真,一经推出就会推动美图秀秀或美颜相机在App Store应用商店榜单名列前茅,也说明了从场景来反推技术的可行性和优势。
大模型助推AIGC能力释放,
质变飞跃驱动净利大增320.4%
AI大模型有实力、有优势是一方面,企业能不能盈利,则是关乎于商业模式、业务结构、经营管理等多方面的事。
细看美图2023中期业绩,同比增长320.4%的经调整净利润背后,最直接驱动力当然是其业务收入。今年美图对营收结构进行了调整,12.61亿元的总收入中包含了四项——
影像与设计产品业务收入同比增长62.2%至6.02亿元,占总收入的47.8%,是美图的第一支柱业务;
美业解决方案业务收入2.86亿元,同比增长31.1%,占总收入的22.7%;
广告业务收入3.49亿元,同比增长28.2%,主要是由于程序化广告的贡献变高;
其他业务收入2309万元,同比减少78.8%,官方解释:这并非经营问题,而是主动关停某些业务导致。
作为第一大支柱业务,影像与设计产品业务是经调整净利大幅增长的核心因素,并且财报中也提到,该项业务收入贡献,也是带动公司整体毛利增长的主因:2023年上半年,美图毛利总额也同比上升49.8%至7.54亿元;毛利率59.8%,比去年同期的51.8%也高出了八个百分点。
影像与设计产品业务为何有如此强增长势头?细究来看,这项业务其实正是最直接受到大模型推动的业务。
影像与设计产品的主要收入模式是VIP订阅,本质上取决于付费用户数量和每付费订阅用户平均收入,简单来说就是看新产品和新功能吸引了多少用户前来付费。如果只是做“刻板印象”里那个简单的修图工具,收入的确很快会到上限。
而2023上半年在AIGC推动下,美图VIP会员数超720万,同比增长44%,创下历史新高,这表明AI大模型已在解决原有的局限。大众对于AI大模型的好奇感和热情度都极高,所以不论是出于新奇或是需求用户都愿意来尝试,自然也就能直接驱动付费订阅用户数量的提升,妙鸭相机用9块9吸引用户尝鲜AI写真而爆红,其实也是同一道理。
为影像与设计产品业务收入“添砖加瓦”的,其实也不仅是想要尝鲜的用户。由于生活场景端与生产力端的影像技术底层是共通的,美图推出的新产品、新功能已经从个人生活场景延伸到了生产力场景。
网红、在线卖家、视频博主、营销人员以及中小企业,过去可能还得找外包团队去修图、做视频,但现在用美图的多种AI工具就能自己完成,显著降低了影像内容的创作门槛和上手难度,自然也更愿意付费。在此次2023中期业绩发布会上,美图公司首席财务官颜劲良就透露,美图设计室的订阅渗透率提升速度非常快。
在2023中期业绩中,美图强调“这其中蕴藏巨大的商业机会”,创作数字内容的生产力工具市场,估算其可能比数字内容创作工具消费市场要大4-5倍。
首予美图公司“买入”评级的华泰证券在研报中也提到了这一点:AI赋能下生产力端工具效率明显优化,美图有望实现付费渗透率和ARPPU值的双端提升,迎来新一轮收入增长。
美图的另一项业务美业解决方案,其实也能充分融合和实践AIGC、借助大模型抬升其商业化能力。目前美业领域的数字化渗透率仍不高,线下业态明显存在零散、信息不对称等问题,这也意味着美图借助AIGC来提升美业数字化,仍有很大发展空间。
对美图而言,做AI大模型并非是“蹭热点”,其多年来在此处的战略布局具有一定连贯性,商业化潜力也突出。美图其实是抓住机遇,在有需求的地方做了自己擅长的事。
依托大模型生长的生产力工具,
每个方向都有颠覆性机会
不论是企业的经营还是大模型的升级迭代、落地应用,都是场持久战。不仅要关注企业目前的业务布局、盈利水平,也少不了要更进一步去观察当下的成绩是否可持续性,以及去关注未来发展如何、想象空间有多大。
美图以“生产力工具全家桶”的形式,展示出以AIGC驱动产品的整体性和持续性。
在今年6月,美图举办第二届影像节,不仅发布了MiracleVision大模型和6款新产品,还形成了由底层、中间层和应用层构建的AI产品生态,覆盖AI图片、AI视频、AI设计以及AI数字人四大领域,这么看来,美图未来的探索方向也更加明晰——
图片是美图的固有优势所在,所以接下来主要是做得更为全面和细化。美图将通过WHEE、美颜相机、美图云修三大产品,一方面去持续探索文生图、图生图、人像等多个细分领域,去满足更多垂直、细节化的实际应用需求;另一方面则是去发展商用场景,借助大模型来真正帮助企业降低运营成本并提高成交转化,为行业降本增效。
视频是当下主流内容形式,所以美图也必然有布局。同样是场景反推技术优化的思路,美图找到了视频制作中的诸多痛点去切入,将繁琐步骤封装、简化为一键操作。比如Wink和WinkStudio将针对视频美容、画质修复等后期制作方面做提效,开拍则主要针对口播视频提供AI解决方案。
针对设计,核心是要用AI去降低难度,让曾经必须专业人士才能做的变得更为简单、普适。美图设计室便担负起了这一重任:覆盖了AI商品图、AI LOGO、AI海报、AI试衣等多个功能,不论你是电商从业者,还是营销用户、办公人员,都能更高效、简单地做设计。
而在数字人方面,根据头豹研究院发布的报告显示,目前这一行业市场规模已达2000亿元,2030年将达到2700亿元,行业应用性很高。美图以DreamAvatar切入,使得数字人更“职业化”,即直接通过AI模特、AI主播、AI客服、AI演员等服务,让他们走进时尚、影视、营销等诸多行业中去做生产提效。
据财报披露,目前美图在这四个方面都已有阶段性成果:比如AI视觉创作工具WHEE自上线以来,其优质AI效果生成数已超过200万。已有超3万家商业摄影机构、超100万用户选择使用美图云修提升修图效率。开拍的月活跃用户数已突破20万,美图设计室已为近百万中小电商卖家提供AI商拍服务……
之前行业中常说:ChatGPT是AI的“iPhone时刻”,一项新技术便能彻底改变整个市场。但我们不应忘记的是,App Store应用生态成熟之后,iPhone才得以普及进入大众生活,随之才生成规模庞大的产业。对应来看国内AI大模型,影像服务可能正是那个能让技术普及开来的“关键一跳”。
某种意义上,美图不是恰巧站在了这个关键点上,更是主力推动者——让影像服务这个行业用大模型“重做一遍”。这并非推倒重建,而是重塑生产逻辑,以技术解放繁杂重复的生产力。若是再放大视角,如今是内容为王、以图片和视频为主的时代,各行各业几乎都离不开影像内容输出,美图的推动力其实有了相当大的辐射面和效用:进一步打破内容与技术的沟壑,让各行业及企业的数字内容创作都实现全流程提效。
拿2010年至2020年的移动互联网的黄金十年来比较,现在AI大模型的黄金时代才刚刚开始。从美图的最新财报看,AI大模型对于美图自身、对整个影像服务行业的增益也才刚起步,但美图未来几年的加速增长已可以预见,值得长线关注和投入。
长远来看,美图走在了一个相当激动人心和有意义的方向上。由此,这家即将迎来15周年的公司,自然也具备了穿越周期的能力。
网易智企发布客服领域行业大模型“商河”
今日,网易智企发布客服领域行业大模型“商河”。商河大模型聚焦于智能客服专业场景,除了使用通用数据进行基座模型训练,还基于网易云商长期积累的海量客服领域语料库进行了模型的监督式微调(SFT)和基于人类反馈强化学习(RLHF)。目前,商河大模型能在坐席辅助、知识库构建、工单创建、会话洞察等场景提供意图理解、文本生成、多轮会话、文本摘要、信息提取、双语问答等能力。站长网2023-09-15 16:28:480000爆火的AI面试,逼疯打工人
曾经出现在银行、外企、快消等领域的AI面试官,正在渗透到更多的行业。一位应聘酒店前台客服岗位的应届毕业生告诉Tech星球,虽然已经接到通知去线下面试,但她仍需去完成企业发来的AI面试。在线下面试现场,面试官也会特地问她AI面试的使用体验,“这家酒店刚推出AI面试,以测试为主,很想知道我们的反馈”。图源备注:图片由AI生成,图片授权服务商Midjourney站长网2024-04-22 08:58:070004HiDream.ai创始人梅涛:做视觉生成模型比扎堆做 LLM 机会更大
近日,HiDream.ai创始人梅涛在接受AI科技评论采访时表示,做一家对标MJ和SD的公司,比扎堆做LLM机会更大。据悉,梅涛曾在微软和京东工作多年,积累了丰富的技术和商业经验。他创办HiDream.ai的目标是在视觉基础模型领域超越国外的StableDiffusion和Midjourney,并实现全球市场的影响力。站长网2023-07-21 22:58:320001用GPT-3.5生成数据集!北大天工等团队图像编辑新SOTA,可精准模拟物理世界场景
高质量图像编辑的方法有很多,但都很难准确表达出真实的物理世界。那么,EdittheWorld试试。来自北京大学、TiamatAI、天工AI、Mila实验室提出了EditWorld,他们引入了一种新的编辑任务,即世界指令(world-instructed)图像编辑,它定义和分类基于各种世界场景的指令。站长网2024-05-30 10:37:520000Mistral AI CEO宣布于2024年开源GPT-4级别模型
#划重点:1.🚀MistralAI首席执行官ArthurMensch在法国国家广播电台宣布,公司将于2024年开源GPT-4级模型。2.💰MistralAI最近宣布获得4.15亿美元融资,估值20亿美元,同时推出“LaPlateforme”以提供其模型的API端点。站长网2023-12-19 14:33:000000