2024大模型应用元年,科大讯飞率先打响商业化第一枪
浩浩荡荡的AIGC潮流,叠加资本资金如火如荼地注入,过去一年里,AI赛道焕发了新生,再度登上了科技语境的浪潮之巅。
然而,与大模型战场的热闹相比,在商业化落地场景,AIGC的步伐却略显踌躇——技术层面,从文字到图像创作再到视频创作,AI屡屡交出了刷新大众视野的答卷,但如何使AI满足实际的商业期望,却仍是摆在行业面前的,一道复杂而严峻的课题。
而这,或许正是今年AI战场博弈胜负的关键环节——唯有从实验室迈向市场,实现商业化落地,才能成为AI领域的“中坚力量”。
1月30日,科大讯飞举行星火认知大模型V3.5升级发布会——全国产化算力平台“飞星一号”、讯飞星火V3.5、语音大模型、星火开源-13B等产品接连亮相的同时,科大讯飞亦端出了诸多大模型商业化成果。
显然,大模型于今年的商业化第一枪,已然鸣响,而随着玩家们接连端出这场盛宴的“主菜”,大模型应用元年亦将到来。
行业桎梏,何以打破
回顾2023年的AI浪潮,各路玩家在大模型领域打得火热,但AI商业化进展却略显迟缓——纵使各类AI应用不断刷新着大众视野,但置之于成熟的商业领域,AI技术的商业化成效,并没能达到预期。
背后的逻辑在于,尚未成熟的AI技术,使得应用开发陷入极高程度的不可控性,而算力的稀缺则在一定程度上“添油加醋”,阻碍着大模型技术迭代发展。
以困扰业界已久的“幻觉”问题为例,若普通用户看到AI输出“疯言疯语”,或许会一笑了之,但在严肃的商业场域,AI的谬误则会被无限放大,甚至对客户企业造成“伤害”。而除却应答准确率,响应时间、成本等维度,亦时刻影响着AI商业化路途。
言简意赅,当下的AI仿佛在技术瓶颈下带着镣铐跳舞。
好在,历史的经验不断告诉我们,革命性的创新很难一蹴而就,就像DOS向Windows演变时,曾面临着科技语境“为何需要图形化界面”的质疑;纵使是iPhone,其初代产品以当时诺基亚拥护者们的眼光来看,也不过是一款不耐摔、不耐用的产品。
然而,这并不妨碍Windows见证了微软的传奇,亦不妨碍其后来的iPhone,点亮移动互联网的光辉时刻。
而如今,大模型的崛起正将万物互联的人机交互推向一个前所未有的高度,这一轮替过程是确定性的。
因此,面对远期的确定性机遇,如何解决当下的AI商业化应用难题,打破行业桎梏,自然成为了AI产业的当务之急。
破局的核心一环在于算力。一方面,大模型技术能力提升的困境主要根植于算力规模递减效应——随着模型规模逐渐扩大,获得相同幅度的提升所需的额外算力成本将逐渐升高,甚至变得难以负担。
另一方面,受地缘政治因素影响,半导体巨头英伟达的AI芯片出口遭到管制,美商务部长近期更是直言“将阻止中国获得算力”。外部压力之下,AI巨头们或多或少面临着算力稀缺的难题。
换言之,国产化算力底座,已然成为了国内大模型玩家补充算力、实现算力可控,从而打破宿命循环的关键道路。
而作为老牌AI玩家,国内AI赛道所面临的挑战,正被科大讯飞看在眼里。
在同华为强强联手,打造出可以私有化部署的“星火一体机”后,科大讯飞再度携手华为,在大模型算力底座层面深度共建,合力打造了“飞星一号”大模型算力平台。两大“正规军”的携手,为国内AI产业突破技术封锁注入了一剂强心剂,在此过程中,华为卓越的硬件基底,与科大讯飞深厚的AI底蕴实现了优势互补。
行业桎梏之下,这既是保障大模型能力进一步迭代与应用开发可控性提升的一张底牌,也标志着一场自主创新的算力革命正式拉开帷幕。而国内AI产业生态发展,从此有了另一种选择。
科大讯飞的三路齐发
如果说,攻克算力底座难题,是科大讯飞乃至国内大模型厂商步入赛道“中场”的关键一环,那么如何在AIGC中场战事中抢得更好的身位,则是一个因人而异,更加复杂的命题。
现阶段,AI巨头们的竞争正在上升到一个更高的维度,玩家们争夺的焦点正从过往的大模型推出与否、大模型参数,逐渐过渡到大模型真实可用性、开发者生态、商业化轨道等层面。
在此背景下,诸如科大讯飞这样的AI厂商,正站在商业化的三岔路口:通用能力输出的直接竞争、开源抢占生态与应用开发,而每一条路径都伴随着巨大的挑战与想象空间。科大讯飞的选择是三条路同时发力。
大模型通用能力层面,科大讯飞一直走在行业前列。
去年11月,在新华社研究院中国企业发展研究中心《人工智能大模型体验报告3.0》评测里,讯飞星火认知大模型蝉联冠军的同时,还获得基础能力指数、智商指数、工具提效指数三项评测指标第一。
目前,科大讯飞则在“飞星一号”算力底座的的基础上,训练出了讯飞星火V3.5。
据悉,相较于讯飞星火V3.0,其在逻辑推理、语言理解、文本生成、数学答题、代码、多模态等核心能力均有着显著提升。其中,语言理解、数学能力更是已然超过GPT-4Turbo,而代码能力达到GPT-4Turbo的96%,多模态理解能力则达到GPT-4V的91%。
这意味着,国产大模型正在逐渐走出了“不断追赶GPT-4”的叙事线,在越来越多的技术领域实现了对于行业标杆的超越。
只是,若想全盘超越GPT-4,除了直面现有不足与缺陷以外,亦需更加开放的姿态,共同推动国内AI产业的技术繁荣。为此,科大讯飞端出了“星火开源-13B”计划,深度适配国产算力,助力开发者、高校、企业自主研发,从而打通共建第一开发者生态的通路。
另一方面,科大讯飞对于大模型商业化的理解,绝非停留于行业表面,而是将其真正融入了自身的肌理。
纵观科大讯飞的发展历程,“语音”始终是其绕不开的烙印,多年以来,科大讯飞在语音识别、语音合成等多个领域,始终保持源头核心技术创新迭代,并多项斩获相关国际权威赛事和评测冠军。
基于此,随着科技脉络步入大模型时代,在智能语音领域扎根甚深的科大讯飞,顺势推出了国内首个语音大模型——星火语音大模型。
据悉,星火语音大模型已在数十个主流语种的语音识别效果层面,超过OpenAI Whisper V3,而多语种语音合成方面,星火语音大模型拟人度则已超83%。
从行业维度来看,科大讯飞之所以推出语音大模型,源于对万物互联时代涌现出的新需求的洞察。
万物互联时代,语音无疑是人机沟通的入口。这意味着,语音大模型将无缝适配智能网联汽车、智能家居、陪伴机器人等热门、前沿赛道,实现对现阶段产品、业务的重塑,发挥“1 1>2”的效用,从而将人机交互推至新的高度。
而作为老牌智能语音厂商,科大讯飞在此领域沉淀已久,技术领先的同时,亦能将应用成本降至“自来水”的价格,从而更好地拥抱“AI 万物互联”时代所带来的全新机遇。
因此,科大讯飞推出星火语音大模型,绝非“硬蹭”自身的核心赛道,而是一位实干派玩家深思熟虑的答案。
大模型,开始落地下潜
无论是打破桎梏,还是技术、产品层面的迭代出新,最终都绕不开商业化层面的真实考核。若技术升级无法换来“真金白银”,那么所谓的AIGC浪潮,很可能演变为一场“重复制造轮子”的科技自嗨,导致人力、时间成本的白白投入。
而纵观千行百业,并非行业端缺乏应用AI的诉求,而是大模型玩家所提供的能力,同行业真实所需存在着一定的割裂之处。
以教育场景为例,若是打造一款面向小学生英语学习的大模型,那相比大模型参数、大模型技术评分等常规评价维度,词汇量范围、语句类型是否超纲,能否嫁接小学英语学习目标,或许才是决定其实际应用效果的关键——纵使模型精度极高、响应极快,但若其一味向小学生盲目输出晦涩的长难句,那显然也不具备可用性。
而究其本质,大模型商业化应用过程,其实是一个考察玩家们对行业需求认知、理解的过程。基于此,诸多大模型玩家,总习惯于埋头于自身的“一亩三分地”,从而沉沦于“舒适圈”。
全然适应所处环境的商业主体,在迁移至新商业生态的过程中,往往会面临繁复的挑战。当下,AI正逐渐成为各行各业须臾不离的存在,而玩家们若是将路走窄,势必会限制自身发展空间。
而科大讯飞,显然参透了这层逻辑——大模型商业化,既要有打靶子的能力,亦要有画靶子的能力。而科大讯飞过往的企服沉淀,使其能更加精准的洞悉行业需求,做出行业真正适用的大模型。
纵向来看,借由业界领先的大模型能力,科大讯飞在教育硬件、语音赛道的护城河正不断加深。
数据显示,科大讯飞AI学习机用户净推荐值(NPS)持续保持行业第一,并获得了2023年天猫&京东双十一销售额冠军;而在星火语音大模型的加持下,讯飞翻译机亦迎来了交互能力升级,将用户体验抬至更高维度。
同时,科大讯飞亦同中国移动达成合作,推出5G新通话商务速记——移动5G用户无需下载任何App,便可在所有手机上,实现通话内容同步纪要,关键事项精准提炼等功能,为大模型赛道的付费逻辑挖掘,提供了另一种视角。
而横向来看,科大讯飞过往在智慧教育、智慧医疗、智慧城市等多个领域积累甚深。这使其在大模型商业化路途中,更好地深入行业本质,从而端出真正适配不同行业面貌的大模型。
据悉,基于对各垂直行业的理解,科大讯飞已同包括太平洋保险、交通银行、国家能源集团、奇瑞汽车等在内的各行业头部企业建立了深度合作。而这些同头部企业的合作本身,则有如一个个钉在相关产业链中的锚点,推动其在千行百业跑出商业化的正向循环。
归根结底,AI要想照亮未来,首要任务是点亮当下。纵观AI赛道数十年的漫长发展历程,当下的AIGC热潮无非“惊鸿一瞥”,这场技术与商业化的马拉松,实际上才刚刚开始。但可以肯定的是,具备自我造血与长线作战能力的科大讯飞,已然拿到了杀出重围的船票。
Lightricks推出AI电影制作工具LTX Studio 可自动生成脚本和分镜头
要点:Lightricks推出AI制作影视工具LTXStudio,助力创作者实现故事可视化。LTXStudio是基于AI的网络工具,通过提示生成脚本和分镜头,用户可调整场景、风格和角色。Lightricks将AI应用于多个产品,致力于为专业人士提供创意工具。站长网2024-02-29 11:42:420000轻松集团 “轻松问医 Dr.GPT” 推出七大AI+健康应用
轻松集团旗下医疗健康服务平台轻松健康宣布其自研的垂直领域大模型"轻松问医Dr.GPT"全面升级,推出七大AI健康应用。这些应用包括智能问诊系统、个性化健康管理顾问、慢性病管理计划、心理健康指导师、医学知识库和技能培训平台、辅助诊疗助手以及患教内容智创平台。通过这些应用,轻松健康为用户提供全面健康管理支持,同时为医护人员提供更高效和全面的诊断和决策建议。站长网2023-12-21 09:12:270000大模型太卷,AI应用就好做吗?
2022年底,ChatGPT推出后迅速在社交媒体上走红,很快,月活用户突破1亿,成为史上增长最快的消费者应用。不久后,国内也掀起了一场轰轰烈烈的大模型竞赛,下场的企业越来越多,都在扬言要赶超ChatGPT。一年过去,大模型没让参赛者看到盈利的曙光,资本市场也在变冷,弄潮儿们发现:AI应用或许比大模型更有机会。站长网2023-12-07 15:58:040001SoraWebui之后,又有开发者开源Sora AI视频生成器模板sorafm
最近,Sora爆火,但由于还没正式开放,大多数网友只能眼巴巴看着。开发者们也不闲着,先把“壳子”弄好,就等着Sora正式开放,填个API就行了。比如之前给大家介绍过的SoraWebui,目前通过模拟DALL-E3的API接口字段进行实现。地址:https://top.aibase.com/tool/sora-ai-video-generator站长网2024-02-22 14:19:340001Meta 开源 MusicGen 模型:用 AI 将文本和旋律结合 创造全新音乐作品
Meta的MusicGen可以根据文本提示生成短小的新音乐片段,并可选择与现有旋律对齐。与今天的大多数语言模型一样,MusicGen基于Transformer模型。就像语言模型预测句子中的下一个字符一样,MusicGen预测音乐作品中的下一个部分。站长网2023-06-12 22:57:150002