登陆注册
585

中国AIGC创新,一场“逆互联网”式创业

站长网2023-04-14 09:08:530

最近两个多月,刺猬公社(ID:ciweigongshe)前往上海、杭州、成都、广州等城市拜访了多家公司。一个惊人的事实是,几乎所有公司——不论是做游戏的,还是做直播电商、新消费、教育培训、健身、播客、长短视频的——都在讨论一个共同话题:

以Chat GPT为代表的AIGC,会如何闯入并改变我们所在的行业?取代我的工作,还是给产业带来新的机会?

这个问题,Chat GPT暂时还回答不了。它可能组织一段逻辑通顺的语言,但想要获得更多新知,乃至找寻AIGC创业的参考,还得把目光放在大厂之外的AIGC创新者们。

在AI生成设计、AI生成虚拟人、AI生成音乐和对话式AI等四个AIGC创业的主流领域,刺猬公社对话了四家不同赛道的创业公司。相比Open AI等国内外大厂,我们能看到他们走出了一条完全不一样的道路:

从某种程度上讲,这些AIGC创新者所展现出的产品、商业和公司组织特质,甚至是“反传统互联网”的。

不问出处,都在人工智能创业

2023年2月,一份叫《ChatGPT团队背景研究报告》的文章在AIGC创业圈、投资圈和媒体圈盛传。研究团队针对ChatGPT项目做出贡献的87个成员进行了背景研究,其中,团队成员绝大多数拥有名校学历,且具有全球知名企业工作经历。他们的显著特征是“年纪很轻”“背景豪华”“聚焦技术”“积累深厚”“崇尚创业”和“华人抢眼”。

在以上这些特征中,名校背景以及技术实力夺人眼球,但更重要的是,对于这些人才来说,走前人未走过的路、开拓一个全新领域,是他们最重要的追求之一。这也鲜明的体现在了刺猬公社拜访的四家AIGC创业公司身上,尽管AI浪潮在2022年才正式开始,但这些公司创立的时间要早得多,在AIGC概念尚不清晰的时代,他们就已经开始了努力。

只不过那时的AI创业,没有如今的喝彩与关注。

时间拨回2016年,伴随VR浪潮的起伏,成维忠和创业团队把目光瞄准虚拟人赛道,于是,专攻虚拟人动作和表情生成技术的中科深智诞生了。但在动捕技术与动作表情库剪辑占主流的虚拟人市场,由深层次AI算法驱动虚拟人技术,并没有引起市场足够的重视。成维忠告诉我们,直到现在,国内外市场中使用这项技术的公司也并不多。

这也让公司的早期融资面临着不小的问题。在研发虚拟人驱动技术的过程中,中科深智也采用过动作捕捉与动作表情库剪辑,但成维忠始终认为,这些都不是虚拟人的原生技术,AI算法驱动才是未来最正确的道路。直到创业四年后,公司迎来了第一笔融资,从2020年中到2021年末,中科深智获得了三轮融资,AI道路得以持续。

2022年是个变局,在此之前,AIGC不能算是虚拟人生成领域的最优解,但大模型技术的发展成熟正在改变一切。在此基础上,中科深智也探索出了虚拟人动作表情驱动的深层次技术——多模态大模型技术。根据成维忠的设想,虚拟人生成技术将会突飞猛进。几年内,AI将能完成动画电影级别的制作,80%以上的动画产品都可以利用AI生成,未来电影工业或许将会发生一场AI革命。

整个行业在“飞跃”,对于几年前的国内AI创业人们来说,这是难以想象的。

同样是2016年,还在清华读博的刘晓光加入了清华大学的一个专攻AI音乐的兴趣小组,这便是新音乐产业公司DeepMusic的前身。DeepMusic最早的目标是帮助音乐爱好者更高效率地创作音乐。但在当时的团队内部,已经萌生了AI基于人的交互生成音乐内容的想法,其实已经很“AIGC”了。

2018年,在刘晓光的带领下,DeepMusic从一个兴趣小组变成了一家科技公司,并拿到了清华系基金和音乐人李健的投资。用AI帮助音乐人创作,乃至AI自主创作音乐,成为了DeepMusic的目标。让刘晓光印象最深刻的是两年之后的2020年,全民K歌找到了他们,希望能够在平台内开发“一键remix”的功能,将已有的音乐伴奏进行风格化改编。

“他们提出的诉求是,一个月做出5万首左右的伴奏。一般来说,一个20人的音乐人团队需要两年左右才能完成。”刘晓光回忆,尽管DeepMusic的AI生成技术已经相对成熟,但并没有产品化,“这个要求是我们产能的10倍。”

这是DeepMusic第一次大规模地应用自己的技术,在建立起了一个流水线化的生产流程后,一个月,他们最终完成了任务,5万首伴奏的通过率达到99%。与中科深智一样,DeepMusic的AI技术同样是应用在企业端的,早期的AIGC创业公司与传统的互联网公司不同,他们不追求直接触达C端,而是以输出技术的方式加持B端,这不仅关于技术能力的发展,更是由市场需求决定的。

直到2022年AI作画兴起,AIGC才真正开始走进C端市场,而DeepMusic一类的创业公司,则在B端更高要求的应用中,不断推进技术的发展。2022年,DeepMusic已经成为了国内头部的AI音乐公司,不仅拥有“配乐猫”“口袋音乐”等创作产品,还与QQ音乐等头部音乐平台展开合作,推出了多个AI音乐系统。

伴随时间的推移,在国内,真正面向更广阔用户,人们触手可及的AI产品也开始出现。计算美学旗下的画宇宙平台正是其中之一。

“从很早开始,我们就觉得人工智能加设计肯定是未来。”计算美学联合创始人赵哲析告诉刺猬公社,在营销场景不断增加的情况下,国内设计人才与设计力仍旧存在短板。想要解决长久以来的供求不平衡,必然需要新技术带来新变革。2020年12月,赵哲析和几个同学一起创办了计算美学,专攻AI设计领域。

他们最先拿出了一款AI生成logo的产品,之后的2022年1月,进阶产品“图宇宙”正式推出,可以在AI技术的加持下实时生成海报。在当时的国内市场,AI生成海报的产品仅计算美学一家,2021年末,计算美学也获得了高瓴创投的数千万融资,新的产品也被提上日程。

不同于大多数AI作画平台,计算美学从一开始的目标就是希望利用AI赋能专业设计,2023年初,他们搭建起一个专业级别的智能设计平台——“画宇宙”,能够实现“无限画板”“实时编辑”,在AI的交互和可控方面更进一步。

值得关注的是,无论是计算美学和DeepMusic,他们的创业团队都有着深厚的名校背景。DeepMusic脱胎于清华大学的兴趣小组,核心成员基本都来自清华大学。计算美学同样有着类似的基因,据联合创始人赵哲析的介绍,计算美学的设计团队基本都来自清华大学美术学院,技术方面的成员则基本都来自清华和北大。

国内顶尖高校背景、年轻的研发团队,他们依靠着自身的学术圈层聚集在一起,共同步入了一个未来风口之中。

而在对谈中,几位公司的创始人都提到了团队的一大特点,那就是团队的稳定。“对于很多算法工程师来说,做AIGC不一样,需要很深度的团队协作,在人工智能的团队里,长期投入才能看到成果。”成维忠告诉刺猬公社,AI创业并不简单,无论是研发技术还是产品,都需要长时间的投入。因此,相比于人员变动频繁的互联网行业来说,AI创业公司的技术团队非常稳固,创业几年过去,团队中最早的一批成员仍旧是中流砥柱。

“我们的核心算法团队从来没有变过。”秘塔科技联合创始人、首席运营官王益为告诉刺猬公社,他的另一个身份被更多人熟知:B站知名UP主“王一快”。

在AI创业之前,王一快是一名律师,2018年,他和几位NLP领域的技术专家一起成立了秘塔科技,最早从AI翻译服务切入,并逐步推出文本校对、改写润色等功能服务。秘塔科技是国内较早利用大语言模型技术推动AIGC内容的公司,“我们的技术路线,从2019年开始做写作猫就已经决定了。”

“2018年左右,我们都认为AI理解上下文语境是非常困难的,当时基本都是单轮问答,甚至单轮问答里面也不能设置太长的条件。”依靠对自身语言模型的不断的深度学习训练,2021年末,秘塔科技已经能够实现AI的多轮对话。

2023年,ChatGPT席卷全球;3月,秘塔科技推出了自研AI文本生成产品“对话写作猫”,算得上国内第一批“中文ChatGPT产品”。在实际的体验中,对话写作猫已经能进行流畅的中文连续对话,并且在法律内容领域展现出了一定的优势。

向对话写作猫提问弱智吧问题

但差距仍然存在,“我们现在这个百亿级别参数的训练量还没有跑完,这更像是个Demo。”不过王一快对于未来信心满满。“我们还有很多办法让多轮对话去变得更加智能,可以期待,在半年之内能够达到跟ChatGPT持平的效果。”

在与四家公司的对谈中,我们能够勾勒出中国AI创业人的大体样貌:他们来自各行各业,基本都非常年轻、拥有名校背景、与此同时关注垂直领域,并拥有足够稳固的团队。跟许多互联网公司不同,他们不在意营销与流量,在AI这个全新的世界里,技术就是王道,而新浪潮的来临,则为他们带来了新的机会与新的挑战。

总的来说,不论AI生成设计、AI生成虚拟人,还是AI生成音乐、对话式AI,这些和大洋彼岸的Open AI、Google和Midjourney们处在同一赛道的中国AI创业者们,都想发挥自己的优势,努力向前奔跑。

中国AI创新者,不想“大干快上”

“我们想用对话写作猫给大家看一下,不是只有巨头才能干好,其实用少一点的资源、小一点点的模型,也能输出一个非常好的效果。”王一快说。

在访谈中,王一快常常把训练模型的过程比作“一个庞大而精细的工程”。它不是可控核聚变那样的颠覆性创新,但AI创新者们需要做的,是在资源有限的条件下,去完成这个可能有着海量细节的工程,为用户呈现出最佳的体验。那些“没钱干不了大模型”“百亿规模的模型就是不行”的声音,王一快并不认同。

以对话写作猫为例,其模型的成本、规模比ChatGPT低了一个数量级,但依然属于大语言模型,同样可以完成效果近似的中文对话。王一快透露,这是因为对话写作猫的模型参数规模更小,但做了更精细化的调优工作。“Open AI和某组织差不多,无限的弹药量——堆算力、扔数据,打出一个比较好的效果;我们创业公司没有那么多钱,用非常有限的资源,只能这么打。”

即便效果可能并不是100分,但对于中国的AIGC创新者来说,有和无的问题更为重要。“我们一定是先拿一个60分的产品出来用着,然后在骂声和叫好声中成长,慢慢地走到80分。”王一快说。

除了低成本和“小步快跑”,将创业方向放到互联网大厂尚未涉足的细分领域,也是很多AI创新者们的选择。

“我们在2018年前后判断,因为大厂的数据最多、资本集中,歌词生成这种自然语言的问题一定是大厂去做的。”而一般的算法工程,很难理解伴奏该怎么变、乐器该怎么弹、旋律该怎么写这类“小众”问题,这就是DeepMusic要去解决的。

在生成音乐的技术路线上,DeepMusic用的是“符号生成音乐”的路径,而不是音频的直接生成。也就是说,让AI检测中音频中的音乐知识,把音乐拆解成各种各样的模态符号,再利用符号去生产音乐。“当符号描述出来以后,一个音乐人已经知道这些符号该怎么去配所有的乐器了。”

这样一来,生成所需技术的复杂度比大模型小很多,但通过符号生成,也可以通过自己的路径达到一个较好的音乐效果。

刘晓光表示,DeepMusic相当重视AI在专业用户中的应用,比如,他们希望让AI辅助音乐生产者的工作,真正嵌入音乐的生产流程里面。

在AI生成的过程中,可控是最难的。比如,当我们生成一段10秒的音乐时,想控制这段的音乐第二秒是什么样的非常困难。而如果不能实现可控,AI也就没办法被音乐生产者真正用上。此外,想要嵌入音乐人的工作流,还要做出一个音乐工作站——苹果系统里的“库乐队”,就是一个简易版的音乐工作站。DeepMusic同样花费了很多技术精力,做出了一个音乐工作站,支持词、曲、编、录、混的AI生成,并且用一个音乐引擎把这些模态结合起来。

与大厂在技术路线上的差异,体现在更多AIGC的细分赛道。CEO成维忠向我们对比了Open AI等大厂和中科深智的区别:

大厂们一般走从大语言模型到文生图再到文字生成视频、动画的技术路径,从生成图片到让图片动起来,“顺理成章”,这种动画、视频被业内称为“帧视频”,本质上是2D技术;

中科深智的技术则更类似3D,能够直接生成3D的动作表情数据,而这些数据本身是看不到的。它绕过了文字生成图片的环节,在渲染引擎的支持下,可以直接给出3D效果的虚拟形象。

而“3D”能带来的好处是,在视频质量和实时生成上有较大优势,能够满足专业内容和人机交互的需要。在元宇宙中也能更加适配3D立体环境,成为元宇宙的基础设施。

“我们自己的定位首先是个技术公司,不是应用公司。”成维忠向我们强调,“我们的核心是搞定生成式AI。”对于业内流行的动作库、表情库、动作捕捉等技术去驱动虚拟人,中科深智从2022年上半年起就逐渐用AI生成,替换用模型库来创造虚拟人的方式。

这不意味着AI创新公司和大厂之间是对立的,也不乏两者合作的案例。比如中科深智,就和英伟达、Unity等公司合作;计算美学,和百度文心大模型以调用接口的方式进行合作。这可以让AI创新公司们“站上巨人的肩膀”,将更多资源用在自己的竞争优势上。

计算美学的一大优势在于打通了各种AI技术之间的壁垒,可以在AI生成的过程中做消除、擦除,也可以做扩展延伸,还可以根据文字进行调优。

在众多文生图产品中,常常需要用户像“抽盲盒”一样,生成好多次才能想要得到一张满意的图片,无法干预生成的过程。“我们一直强调AIGC的能力要可控”,赵哲析说,“越可控,效果越好,越能为客户产生价值。”

“我们应用层更多的是以需求为导向去做创新”。赵哲析告诉刺猬公社,AI产业可以分为三层——基础层,也就是阿里云、腾讯云、华为云等云计算厂商,他们负责提供算力;模型层,以百度文心、Open AI等大模型厂商为代表;而计算美学处于第三层——应用层,在以上底层能力的基础上,开发创新性的应用产品,而不是做前期投入较高的基础性研究。

商业化:AI、G、C,该走哪条路?

在AIGC的商业化上,追赶Google和Open AI的中国AI创业者们常常被诟病的,不是商业化太慢了,而是太早就赶着去做商业化。

有人举例子说,百度度秘(小度前身)刚学会基本对话就做了小度AI、阿里达摩院对话机器人刚能说话就转向阿里小蜜客服机器人、无人驾驶刚学会低速行驶和认障碍物就搞无人车配送,认为“国内的AI一出生就接受生存教育,未成年就走出家门去赚钱。”

先不论这种声音是否片面,但它道出了国内AIGC创业的一个困境:要在何时、以何种方式走向市场,与千行百业发生联系?

“作为一个实际的从业者,抱怨或者指责没有意义。”对于“国内AI商业化是否操之过急”的问题,王一快认为各个国家有不同的国情,AI产业的发展模式也不会相同。只有顺应潮流,满足大家对AI发展的期待。

“你不早点让它落地,这事就做不起来。”他说,特别是在国内,“用户和企业都是非常实际的,谁效果好、谁能快速地给我带来直接的收益,我就用谁的,而不是迷信大厂。”

除了对于“何时搞商业化”的讨论,AIGC商业化的焦点还集中在以下两个维度:

一是AIGC商业化的方向,是靠AI赚钱,还是靠AI生产出的内容?

二是要做To B,还是To C?

先看第一个问题。对于“AIGC”这四个字母,刘晓光将之拆分为AI、G和C,其中AI意味着内容生产的形式,G代表内容生产的过程,C就是生产出来的内容。

AI的意义,在于让生产变得更快、更便宜。内容本来就可以不依靠AI生产出来,但AI的参与,能让投入产出比小于1的事情大于1,让它变得商业价值。从这个角度看,AI的商业化核心,在于解决To B的问题。

相对来说,G和C更加偏向To C,就是“做一个AI,让用户能够生产出可消费的内容”。而这种模式和20年前互联网“羊毛出在猪身上狗买单”的商业模式没有本质区别,都是通过产品吸引用户停留,然后在用户时长的基础上卖广告。

“现在没有流量红利了,所以这种模式可能并不是现在应该优先尝试的方向。”刘晓光说,“做一个更好的内容生产工具,让人生产出可消费内容,然后聚集起来做一个平台,这件事可能很困难。”

比如DeepMusic的产品“口袋乐队”,在没怎么投流的状态下仍能留存不少忠实用户,但刘晓光不认为在此基础上做个内容社区是个好选择。相比无数渴望实现从工具到社区跨越的互联网从业者,这种思路显得颇为不同。

DeepMusic AI生成的音乐集

在UGC时代,内容就已经迎来了大爆发,到了AIGC时代,内容生产的成本又低了几个量级,C的供给越发远大于求。比如音乐,2022年中国生产了大约300万首音乐,而人们会去听的,只有几千首。在流量红利消失之时,只有那些具有消费潜力的内容——那些用户愿意去看、愿意去听的——才有价值。

既然AI内容社区和AI内容本身的商业化困难重重,那么,什么才是AIGC商业化的希望所在?

“C可能并不是下一个爆发点。”刘晓光说,“G可能是下一个内容生产的爆发点。”

他进一步解释,过去可能有人对一件事感兴趣,但被一些复杂的学习门槛卡在外面;现在,由于AI的参与,不用学习也可以参与制作,摆脱知识的局限,并在其中找到心流体验、感受有趣的生产过程。最终,人们可以利用AI工具去完成艺术探索,实现AIGC对UGC的反哺。“我们实际上是在做AI音乐制作人,把音乐生产各个环节里的辅助工具给到用户,让AI告诉你怎么去做音乐。”

至于做To B还是To C,受制于国内用户付费习惯的限制,面向To B客户做标准化产品,是AIGC创业中的主流选择。“做技术的公司一旦开始个性化定制,规模效应就出不来。我们公司成立以来,只要是做都是以标准化产品为主。”成维忠说,目前主要收入来自于SaaS服务,即使有定制的需求,也只提供虚拟人底层能力的定制,其他的定制工作都是交给其他合作伙伴集成商完成的。

“一定是要做标品的。”王一快也表示,在To B的业务中以标准化产品为主,向用户提供大模型的API接口。“如果做模型的定制,目前看来耗费的人力、提供的服务还是非常重的,可能只会按照大的行业去进行调优。”

赵哲析也认为,“AIGC商业化更多的机会还是在To B上面。”To C更多的只是围绕流量做用户转化,但尝鲜用户的多是一次性行为,深入使用和付费意愿也相对较低。因此,计算美学从一开始做产品就是定位在面向To B行业。

想要在To C上做商业化,也不是完全没有空间,只不过机会可能不在国内。成维忠透露,他们想要在海外布局一个可以由文字生成3D动画的产品,以订阅制方式做商业化,不再区分To B还是To C。

不过,对于AIGC创业者们来说,一切其实都在变化,远未来到定局。赵哲析告诉我们, 他的工作时间里7成是在解决现有的需求,3成要在做探索。“最懂AIGC的应该是我们这些从业者,不能指望着你的客户去你提需求提得特别精准。”

这种工作逻辑有点像调查和实验:提出假设、论证假设,修改假设再去论证假设,最后把它变为真正能落地的东西。“创业最怕剃头挑子一头热,你以为解决了一个天大的需求,找到目标客户一问人家说不需要。”赵哲析说,“我们是很务实的。

AI的未来,人机交互革命?

商业化、供需、应用,在一系列行业面对的实际问题之下,AI创业者们脚踏实地,但也把目光投向了未来。

在与四位创始人的对谈中,几乎每位都提到了“人机交互”,在他们看来,AIGC不仅是生成内容的变革,更在于人机交互形式的革新,这也是他们能在浪潮来临前入局AIGC创业的深层原因。

“最早我们与计算机交互可能是纸上打孔,之后是DOS系统的代码,随后是利用鼠标和键盘与计算机交互,再到如今用手指点屏幕,下一步,很可能就是利用语音直接与机器进行交互。”在刘晓光看来,未来可能会出现基于自然语言交互的操作系统,对于偏向内容型的服务行业,会有一个新的入口可以去占领。

“我们希望音乐能够被更多感官所感受,实现更游戏化的音乐欣赏过程以及娱乐过程。”在做音乐AIGC的过程中,DeepMusic一直希望把音乐变成一种“不只通过耳朵摄入的内容”,用声音的模态和图像、视频的模态结合起来,生成多模态的内容,为用户提供一种新的服务形式。

这并不是一种“空中楼阁”式的设想,在刘晓光的认知里,AIGC将开拓更多元的交互场景与内容消费方式。“一些小公司没有能力去做大模型,那是大资本集中去做的事。但在应用上,AIGC可以做到许多新的服务形式,并且找到新的入口去占领。”

刘晓光特别看好教育和游戏领域的“强人机交互”属性,“用户在付费的时候都会有一个心理钱包的问题,比如说为了一个工具、一个视频平台付费,意愿可能没那么强,但为了游戏可能会花很多钱。”因此,AIGC第一波成功的商业化,很可能发生在游戏化或者教育化的应用上。

计算美学同样是在人机交互协作的理念下,才开发出了画宇宙这样的工具类AI产品,他们考虑到的则是未来内容生产模式的变化。

“人机协作方式利用AI把设计变得可量化,帮助设计师的生产。”交互也体现在了产品的设计上,“画宇宙”让AI作图不仅是人输入指令、AI生产作品那么简单,而且利用智能工具总结梳理素材,并进行实时修改与编辑,真正实现人机的共创,“这是以往产品形态做不到的”。

这并非是一厢情愿的构想,在2023年,AIGC及大语言模型技术已经在改变内容生产的模式,“人机交互”的革新也正在发生。3月16日,微软的Copilot正式发布,其将大型语言模型的能力嵌入到Microsoft365应用程序中,在Word、Excel、PowerPoint、Outlook等产品中都有应用。

我们能够清晰的看到生产与工作的方式在被改变,无论是根据用户需求生成文档、PPT,还是协助用户分析数据,制定计划、编写讲稿,借由AI强大的理解能力,人机交互变得更加有效,大量的生产力将被解放。

这或许将不亚于从DOS系统打孔输入指令到鼠标键盘交互的变革。AIGC的发展不仅是AI智能提升这么简单,更重要的是其能更好的整合数据资源,实现高效率的指令触达,并且这种提升是指数级的,人与机器、算力的关系将被重构。

“我们最近在梳理一个新的领域,NUI,也就是自然用户界面。”同样的,在中科深智的构想中,AIGC的发展将催动下一代操作系统的诞生。过往的功能菜单将会被自然语言对话取代,想要实现交互,只要最简单的对话与动作就能实现。

成维忠还将人机交互革新扩展开来。他提到了元宇宙概念,作为把沉浸式体验作为核心研发方向的公司,中科深智一开始就把AI算法驱动虚拟人视为通往真正元宇宙的入口。

他认为,在视觉技术、XR技术的发展之下,元宇宙的场景、物品都能得到不错的解决方案,目前相关技术也已经较为成熟,但在元宇宙中“人”则是最难点。无论是虚拟空间的NPC,还是现实人类的虚拟化身,都需要更好的交互体验,而AIGC则是最重要的解决方案。

“元宇宙它本身其实是更加社交属性的,在虚拟化的社区里,人和人之间的交流就变得非常的重要,没有非常好的Ai的技术,实际上就做不到真正的千人千面,所有人的动作表情都一样。”AI则能成为解决实时交互问题的核心技术,在成维忠的眼中,AIGC的发展成熟更能够催动真正元宇宙的来临。

对于元宇宙行业来说,ChatGPT及大语言模型为代表的AI生产力或许并非取代者,而能够带来真正的加持。在过去的元宇宙设想中,高效率的数字资产生产与有效的社交交互是虚拟世界的最大痛点之一,而在AI技术的加持下,无论是场景、道具生成,还是虚拟人驱动,或许都将迎来新的机会。

在未来,3D内容创作者或许也可以将AIGC技术应用于创作中。不同于以前的费力建模,伴随AIGC的发展,输入prompt、或者“口述”,场景与人物、道具就能直接生成,同样也能加持人们的虚拟体验。据悉,世界最大的“元宇宙”平台Roblox正在构建一个AIGC平台,希望发展通过语音、文本或基于触摸的手势,取代鼠标和键盘移动,即可实现傻瓜式创建的便利工具,通过AIGC将其平台上5880万用户打造成为创作者。AIGC正在真实的改变这些新兴的行业。

说回国内的AIGC创业者们。在这场人机交互革命之中,微软、谷歌、OpenAI等大厂所做的,就是依赖大模型产品搭建新一代操作系统的基础设施,正如百度CEO李彦宏在近期的访谈中所说,不会再出现一个OpenAI,没必要重复造轮子,在技术底层、大模型技术领域,在客观条件之下,国内AIGC创业公司或许已经失去机会,但在应用层,一切都还刚刚开始。

大厂们忙着搞“基础设施”,而我们所关注到的这些AIGC创业公司们,则在各个垂直领域深扎下去,依靠他们掌握的技术及产品,或许能够成为这个未来操作系统的组成部分,也就是一个个具体的“功能”。这也是属于他们的天地。

尾声

在刺猬公社遇见的AIGC创业者中,始终有着一个疑问,AI产业的春天真的到了吗?

产业大爆发的卡点,恰恰是AIGC技术本身。

成维忠举了AI生成虚拟人方面的例子——现在能生成双人的交互,多人交互还做不到。只有进一步突破技术障碍,才能未来在游戏、动画等领域大规模应用。刘晓光表示DeepMusic希望做些“增量”,在AI技术的支持下,让更多人参与到音乐的生产过程中,“真正让内容生产者,用AI工具做自己想做的事。”

至于商业化的难点,“我认为没啥难点。”成维忠说,“因为技术还没到,所以能啃下的市场还是很少。挖空心思地‘想出一个市场’去规避掉技术问题,我觉得没必要。”未来,做AIGC还是要拼技术赚钱。

因此,此时此刻正处于聚光灯下、浪尖之上的AIGC创业者们,也要做“时间的朋友”。

“等风口过去了之后,才真正进入落地的场景。”王一快说,“就像我们当初讨论5G一样,等到现在都不讨论这件事了,说明它已经成了一个基础设施,大家真正能用上了。”

0000
评论列表
共(0)条