让“郭德纲”说英语相声 HeyGen的视频生意不好做
听郭德纲的新相声了吗?飙英语的那种。
最近,一段“郭德纲用英语说相声”的视频在社交平台传疯了。视频中,老郭用自己声音说的英语不仅发音准确,嘴型自然,语法错误都少。
实际上,这段视频又是AI技术参与的二创作品,这个“没有翻译腔的真正翻译”作品被网友怒赞,不少人觉得,即使是真人配音也无法达到这样传神的效果。
深扒一下发现,这段爆款视频的背后有一家名叫诗云科技的中国公司,他们的产品HeyGen就是把郭德纲相声中译英的“神器”,AI翻译仿声打得其实是视频制作生意的算盘。
如果说“AI孙燕姿”显示了AI仿声的能力,妙鸭相机展示了AI处理图片的技艺,HeyGen用则用“英语相声”呈现了AI的多语言能力。
过去以高端示人的人工智能,正在以人民群众喜闻乐见的方式走进大众视野。娱乐过后,“AI孙燕姿”的话题降温,妙鸭相机也因非高频、刚需而昙花一现,HeyGen又如何不步后尘?它的出现真的能直击视频制作的痛点吗?
AI仿声再进化能说外语了
今年10月,“郭德纲说英语相声”的视频在全网火了,B站浏览量达到几百万,并迅速带动UP主们创作名人说外语的反差视频。
于是,老郭不但能说英语相声,还能用英语访问本山大叔,对方也是说的英语,访谈节目一下变得International(国际化)起来;而“于谦大爷”也能唱英语Rap了,“泰勒·斯威夫特”和“艾玛·沃森”甚至在访谈节目中用中文对答如流。
这可不是给人物配外语字幕或译制片一样的配音,而是真正让人物操上了一口流利的外语,不仅声音神似本人,连在嘴型都能对上,这样的视频在海外视频平台也火了。
爆火的翻译配音视频背后是AI工具HeyGen在发挥作用,即展现了AI对语言翻译的能力,也再次炫技了AI仿声,效果被网友怒赞。
在排队等待7000个视频后,网友@Gorden Sun在HeyGen上只上传了一段原素材就制作出了霉霉说中文的视频,“效果绝对目前最好,没有之一,”他也表示,“声音克隆稍有缺陷”、“情感还原度稍有欠缺”。从他的体验感受看,属于瑕不掩瑜了。
网友排队7000个视频,生成霉霉说中文视频
借助HeyGen工具,用户只需上传视频,选择语言,就能自动翻译,调整音色,生成嘴型匹配的外语视频。
很快,一大批AI翻译仿声的有趣视频就此出现,很多视频的观看量都破百万,HeyGen也因此大圈了一波流量,最火爆的时候,生成一段视频,前面排队的都有几万个。比前段时间人们用妙鸭相机生成写真照片的时间都长了去了。
值得注意的是,HeyGen背后是一家名为诗云科技的中国公司,2020年11月成立,该公司官网显示,其产品除了AI翻译仿声,还有AI数字头像生成、AI脚本生成等服务。
天眼查显示,诗云科技已完成两轮数百万美元融资。其中2021年3月,诗云科技获得红杉中国种子基金和真格基金的天使轮投资;同年8月,又获得数百万美元Pre-A轮融资,由IDG资本领投,红杉中国和真格跟投。
据悉,HeyGen的目标是要做到AI视频创作领域的Midjourney。目前,它背后的团队团队大概30人。尽管HeyGen尚未达到Midjourney的用户体量,但也成功成为了国内市场上继“妙鸭相机”之后最新的一款爆款AI应用。
根据社交平台X上一位网友的统计,今年8-9月,各大文生图、文生视频类AI网站的访问量均开始呈现下降趋势,但HeyGen的访问量实现了逆势上涨,上升高达92%。
HeyGen的访问量逆势上涨
创始人Joshua Xu曾透露,HeyGen产品正式上线后,在7个月内实现了100万美元的ARR(年度经常性收入),并保持连续9个月50%的月环比增长率。
推出付费版击中视频创作者痛点了吗?
访问量持续上升,HeyGen这样的态势还能保持多久?这与它是否能切中视频制作的痛点有关。
AI生成写真的“妙鸭相机”一度被誉为“能暴打海马体”。而如今,海马体活得好好的,以小程序形态面市的妙鸭相机,流量指标经历了约3个月的短暂高峰后出现断崖式下跌。微信指数显示,目前“妙鸭相机”的指数趋势已经回到爆火前的水平。
“妙鸭相机”的火爆昙花一现
以“写真”走红的妙鸭相机走不长,是因为面向C端的写真照片并不是普通大众高频且刚需的场景,尽管也需要付费,但妙鸭相机没能在写真之外创造更多的功能,用户的付费意愿大大降低,用完即丢也就成了必然命运。
HeyGen也是因大众在短视频娱乐中再次发现了AI的亮点而走红,进而进入了视频创作者的工具库里。但这个工具真的能直击视频创作者的痛点吗?
在知乎、抖音上,不少视频博主们分享过视频制作的真实痛点。爆款视频的背后是脚本创作、拍摄、后期剪辑等制作环节的高成本投入,AI生产力的确能解决成本问题,但创意仍需要人类发挥。
目前,HeyGen主要提供四项功能,可以用AI视频工具制作各种用途的视频,比如产品营销、内容营销、销售推广、学习培训等;用户可以使用平台自带数字人形象、真实形象或AI绘画形象,让人物说不同语言。目前,HeyGen支持40多种语言。
可以看出,HeyGen在尽力引导产品扩展视频创作的应用场景,但似乎并不是要解决视频创作者的痛点,更多是利用AI的仿声翻译能力让视频内容跨国、跨地域传播。
目前,HeyGen推出了免费版和付费版两种版本。付费版最便宜的需要每月24美元,未来将逐步开放API接口、团队协作和企业功能。而免费版仅限于生成1分钟时长视频,且生成需要排队等待很长时间。
很明显,HeyGen的盈利来源主要在B端。10月底,商业版本上市,新功能包括可以生成长达3小时的内容;画质最高提升至4K;能帮助用户制作PPT;可以文本转视频,支持音频上传、视频分享等。商业版HeyGen可以满足广告、电商、新闻等行业各种需求。
升级后到的HeyGen仍然重场景,回避了视频制作者在创作环节上的刚需。
而在视频制作场景中,AI工具依然不少,几乎都冲着制作环节而去。例如能直接将脚本转化成视频的Pictory.AI,可以实现AI语音、匹配素材与音乐的功能;腾讯智影、一帧秒创、万彩微影这些应用也利用了AI技术来简化视频创作过程,并提供了文本配音、文章转视频、数字人播报等功能。
但所有做视频生意的AI工具都绕不过版权问题,而这个问题是最令视频创作们瑟瑟发抖的困境之一。技艺从AI仿声进化到译制的HeyGen也不能解决版权问题,难题还是抛给了视频制作者。
当前,HeyGen被广泛应用于短视频的二次创作,比如AI换声等。对此,有律师表示,用AI技术为他人更换声音、做“翻译”并发布视频,可能涉嫌著作权、肖像权、声音权三个方面的侵权。比如,相声、小品等都属于《中华人民共和国著作权法》保护的“作品”。网友用AI软件将相声、小品等“翻译”成其他语言,需经过著作权人授权,否则就存在侵权问题。
此外,网友用他人形象制作视频,并在网站发布,需要取得肖像权人的同意,否则涉嫌侵权。最后是声音权,根据《中华人民共和国民法典》规定,对自然人声音的保护,参照适用肖像权保护的有关规定。也就是说,需要取得声音权人的同意,才能够使用他人的声音。
从去年年底至今,由ChatGPT打开的AI魔盒仍在不断展现新魔法,人类似乎拿到了人工智能的车票,但顺利搭上这列提升生产力的高速列车,似乎还得等很久。
体育画报出版商CEO罗斯·莱文索恩因人工智能丑闻辞职
上个月末,《体育画报》陷入人工智能丑闻,揭露杂志一直在发表由不存在的作家署名并搭配人工智能生成的个人资料图片的商业文章。该事件导致两名高管被解雇,而现在,体育画报出版商TheArenaGroup的首席执行官罗斯·莱文索恩(RossLevinsohn)宣布辞职。0001IBM在印度甘地讷格尔开设新的客户创新中心 聚焦生成式AI
划重点:1.🚀IBM宣布在印度甘地讷格尔开设新的IBM咨询客户创新中心,标志着该公司在印度非大都市和新兴城市的持续扩张。2.💡该中心将聚焦生成式AI、混合云和网络安全等关键技术领域,加速数字转型并促进该地区的经济增长。3.👥甘地讷格尔的扩展将为现有员工提供机会,同时帮助IBM吸纳该地教育生态系统中的潜在人才,包括毕业生。站长网2023-11-24 16:50:280000小米15系列开启官网预约:全球首发骁龙8至尊版处理器
今天,小米公司在其官方网站上宣布了小米15系列的上架,并开启了预约服务。根据小米官网的信息,消费者在小米15系列首次销售时可以享受最高24期的分期免息优惠,以及以旧换新活动,最高可获得1400元的补贴。此外,还有保值换新服务,最低只需9.9元起。0000Meta华人提出语言模型Shepherd 用于评估模型生成
最近,MetaAI提出了一种新的语言模型叫做"牧羊人"(Shepherd),用于评估其他模型生成的文本,并给出改进建议。这个模型使用了约70亿个参数,并通过社区反馈和人工标注的数据集来进行训练。站长网2023-08-15 14:14:080000Yotta挑战超大规模云服务提供商 推出印度首个以人工智能为中心的GPU云
Yotta计划在2024年6月之前推出4,000个GPU,并在2025年底前达到32,768个GPU的规模。全球数据中心市场预计在2023年达到3259亿美元,年增长率为6.12%,2028年市场规模将达到4387亿美元。预计美国将以9558亿美元的收入领先。0000