“非主流”AI语言App爆火,单月流水冲上百万美金
导语:AI 学语言是在 AI 经历了两年快速发展之后,少数看到了明朗商业化前景的细分赛道之一,也因此,同时也是目前 AI 应用中最为拥挤、竞争最为激烈的赛道之一。
但就在最近,一家初创公司却凭借着“口音纠正”这样的差异化切入点杀出一条血路。
口音测试,风靡简中互联网
最近,简中互联网上“英语口音测试”突然风靡。玩法很简单,只需要访问特定链接,按照指示录制一段英文语音,数秒后你将会得到一个检测到口音归属国家的结果。(访问网址:https://start.boldvoice.com/accent-guesser)
这个简单的口音测试游戏让众多网友玩得乐此不疲。
有人模仿日本人、法国人的口音,企图骗过 AI。也有人因为被多次识别为100% 中式英语而“恼羞成怒”,用奇怪腔调、甚至四川话应对,却意外得到了母语者的超高评价,靠不靠谱另说,但节目效果拉满。
图源:小红书
类似的热闹景象也发生在外网。“成分复杂”的海外网友争先恐后地让 AI 检测自己的口音成分,部分检测结果准得惊人。比如以下这位曾经在中、美、韩三国有长期生活经验的网友,最终的识别结果即为拥有以上三地口音。
这则短视频在TikTok上拥有
超过200万的浏览量|图源:TikTok
网友在这场游戏中得到了快乐,其背后的厂商 BoldVoice 则获得了获得了喜人的增长。
BoldVoice 是一家成立于2021年的美国公司,其同名应用 BoldVoice 致力于帮助非英语母语者减少口音。Similarweb 数据显示,BoldVoice 官网12月访问量相较上月增长了3308%,达到723万次。增长另一方面体现为收入飙升,SensorTower 数据显示,BoldVoice 移动应用版本的月内购收入首次来到了96万美元。
BoldVoice移动应用版本的12月内购
收入为96万美元|图源:Sensor Tower
减少口音,潜在量级达千万的细分语言市场
区别于多邻国、Speak 在内的常见语言学习产品,口音改善应用瞄准的完全是另一波人。后者已经完成了语法和词汇的学习,却困于母语口音的影响无法自信流利的表达,属于进阶需求。这一需求的发现源于 BoldVoice 创始人 Anada Lakra 的亲身经历,同时她认为这一市场非常广大。
BoldVoice应用商店海报
Lakra 出生于阿尔巴尼亚,当年来耶鲁大学读本科时,她是全家第一个去过美国的人。新环境让她很兴奋,但很快,英语交流成为了最大障碍之一。
来到美国之前,Lakra 差不多学了10年的英语,也通过了所有申请美本需要的英语标化考试,她一向对自己的英语能力自信满满,但是和母语者交流却狠狠打击了一下这位初来乍到的小姑娘。Lakra 发现,本地人总是听不懂她的话,要她重复,更要命的是在课堂、工作等正式场景中,口音问题往往会分散人们对于内容的关注,最终影响了她公开表达的意愿和信心。而这种困扰在英语作为第二语言的国际学生、移民群体中相当普遍。
Reddit网友讨论口音偏见问题|图源:Reddit
研究表明,人们可能会因为口音,认为某个人不够聪明、受教育程度低甚至能力不行。具体到工作等正式场合,一项发表在《应用心理学杂志》的研究表明,口音会左右管理者对员工语言流利度的看法,并进一步影响对其表达能力的预期,指向了口音与职业机会相关。这项研究还表明,口音问题可能会导致人们在工作中觉得被排斥和被贬低。而口音问题波及的不只是学生和打工人,即使是老板也可能会被“另眼相待”。
著名的创业孵化器 Y Combinator 的创始人 Paul Graham 在对外交流中承认,当他考虑是否让某位企业家进入旗下项目时,“浓重的外国口音”通常对候选人不利。后来他澄清,“问题不在于口音所传递的文化信号,而在于当人们无法理解你时,一家初创公司的起步会变得更加困难”。口音的确无可避免地会携带有关说话人的出生地、经济阶层等背景信息,与此同时,更直接的是对沟通效率的影响,也正是 Anada Lakra 经历的“本地人听不懂她说的英语”。
截至2023年,美国有4780万移民,最常见的原籍国依次是是墨西哥、印度、中国和菲律宾(皮尤研究中心数据),多数移民都因为母语非英语而带有不同程度的口音;类似 Lakra 的情况,每年都有100万的国际学生来到美国;而随着英语成为全球主要的商业语言,赴美经商/工作的人增加,更多的非英语母语者会有意愿突破“口音”这道语言学习的最后屏障。
然而要纠正一个人养成多年的发音习惯并不容易,一直以来,市面上最主要的口音问题解决方案是参加真人“口音训练班”,这类课程普遍收费不低。视线上/线下授课、老师经验程度不同,定价在50美元/小时到数百美元/小时不等,没有这笔预算的人就只能自学,这也是 Anada Lakra 早年选择的路径,她深知其中的艰辛。所以当2021年她听到越来越多有关 AI 和语音模型的消息,她立马意识到自己可以做点什么来帮助非英语母语者来克服口音难题。
某1v1口音课程的售价为90美元一小时
两位非英语母语者,打造“口腔健身房”
本科毕业后,Lakra 曾先后在 Peloton 和麦肯锡工作,后又到哈佛商学院攻读 MBA;另一位担任 CTO 的联创 Ilya Usorov 也不是英语母语者,他毕业于纽约大学,曾就职于在线商业课程平台 Section4。BoldVoice 在起步不久就得到了来自 YC 的投资,最新一轮融资发生在2023年8月(种子轮),融资总额达到了610万美元。
Lakra 对发音练习的认识是,区别于词汇、语法等更偏向大脑记忆和理解层面的学习,发音发生在口腔,是对口腔肌肉的控制练习,后者更关注恰当的舌头放置位置以及口腔张合程度等等,因此 BoldVoice 被团队戏称为“口腔健身房”,也导致了其教学方法和常规的语言学习产品不太一样。
BoldVoice|图源:BoldVoice
BoldVoice 结合了真人演示和 AI 纠音两大教学模式。用户先录制自己的语音,借助 AI 评分找出改进之处;再观看好莱坞口音教练的视频演示,观察、模仿地道的发音方法。虽然不少语言学习产品已经包含发音纠正功能,但专注的 BoldVoice,功能设计上还是有诸多不同,除了设计了专门的发音课程之外,在自由对话版块,后者会将对话目标精确设定到使用特定单词、使用后缀 “-ing” 的单词三次等,而完全省略对词汇量扩充或语法纠正的关注,最终指向的是针对重点单词、音标的发音建议。
从句子、单词到回归音标的发音练习 |图源:BoldVoice
BoldVoice 在发布后的很长一段时间里,都是以美国本土的非母语者为主要用户,其中相当一部分应该是移民。AppMagic 数据显示,BoldVoice上线至今超7成的收入由美国用户贡献,下载量也有超6成来自美国。然而12月爆火的“英语口音测试”已经逐步打开了 BoldVoice 在美国之外的市场的声量,并进一步突破产品收入的天花板。当月,美国市场的收入/下载占比均降至3成左右,在韩国、中国、日本、加拿大收入均有明显的增长,去年4月 BoldVoice 刚宣布达成100万美元的 ARR,如今仅12月单月的内购收入就已接近这一数字。
BoldVoice11月至今收入变化曲线|图源:点点数据
写在最后
所以 BoldVoice 推出的口音测试真的准吗?由推特博主 ChristoGrozev@bsky.social 发起的,一项由577人参与的投票显示,超过7成人认为 AI 猜得很准。
图源:X
而一个引发病毒式增长的口音趣味测试背后,可能更加值得思考的是,团队如何发现这一细分需求,又如何包装“减少口音”这个可能涉及复杂的文化和情感因素的需求点。可以看到的是,BoldVoice 始终没有把口音“问题化”,强调给予帮助,而非要求用户迎合某种标准。作为一款全球化背景下的语言学习产品,这种对于文化敏感性的深刻理解,或许值得厂商参考借鉴。
参考文章:
《Accent Bias: How Can We Minimize Discrimination In The Workplace?》, Forbes
《This Mobile App Helps Non-Native English-Speakers Craft A Confident, Bold Voice》, Forbes
《BoldVoice: Perfect Your Accent with an AI Coach | Startup Story | Ep1》,The Lobster Talks
查理·芒格的最后一次重大判断可能是正确的:人工智能被过度炒作
查理·芒格,伯克希尔·哈撒韦公司的传奇投资者,于当地时间周二99岁高龄去世。他与投资伙伴沃伦·巴菲特一起投资苹果、好市多和可口可乐的决策,巩固了他作为传奇投资者的声誉,并推动伯克希尔·哈撒韦的现金储备攀升至创纪录的1570亿美元。站长网2023-11-30 11:49:380001不止AI音频、还打破了连接界限,第一代高通S7系列音频平台解析
最近这几天,高通方面在夏威夷举行的2023骁龙峰会上发布了多款全新的芯片。除了我们三易生活此前已经为大家做过详细解析的骁龙XElite和第三代骁龙8这两款“大芯片”外,其实还有两款体积上比较小,但在技术层面同样“重量级”的方案也很值得关注。站长网2023-10-29 10:05:160000Tarsier:构建基于视觉交互的多模式网络代理工具库
Tarsier是一个开源的简单实用的多模式网络代理工具库,它提供了视觉标记可交互元素、页面截图OCR识别、文本元素标记等功能,为网页交互代理提供了更深层次的视觉和文本处理能力。该工具库通过在页面上使用方括号id的方式对可交互元素进行视觉标记,提供了元素和id之间的映射,使得GPT-4(V)可以对这些元素进行操作。项目地址:https://github.com/reworkd/tarsier站长网2023-11-15 18:22:590000贾鹏雷:ChatGPT引发行业变革,电商未来如何狂飙?
贾鹏雷,亿邦动力总裁、马蹄社发起人,知名电子商务观察人士,拥有20年媒体经验。在蝉妈妈2023数字营销创新大会上,他分享了《ChatGPT引发行业变革,电商未来将如何狂飙》,以行业媒体视角,聚焦行业热点,直击行业发展痛点,以全局视角洞悉电商最新发展趋势。以下内容整理自贾鹏雷的现场演讲:站长网2023-05-17 18:12:390002每周AI大事件 | 复旦MOSS大模型开源、ChatGPT推企业版订阅、AIGC人才需求猛增
欢迎来到站长之家的[每周AI大事件],这里记录了过去一周值得关注的AI领域相关内容,帮助大家更好地了解人工智能领域的动态和发展风向。(图片由Midjourney生成)Part1动态[国内要闻]作业帮推出AI老师一对一学习机站长网2023-05-12 20:26:510002