B站UP主用AI声音克隆原神各角色 视频播放超136万
站长网2023-11-14 14:18:221阅
最近,B站UP主“小虫哥_”发布了一部原神二创视频,其中各个角色模仿芙宁娜的台词和动作,但保留了原本的声线,给网友来了亿点点震撼。截至发稿日,该视频已经获得了超过136万的播放量。
许多原神玩家被吸引的原因可能在于“陌生的熟悉感”,因为看到熟悉的角色模仿另一个角色的台词和动作,引得不少网友在评论区@同好直呼“不能只有我被创”。

有网友在评论区发问关于动作和建模的问题,还有人问“这大招语音怎么回事啊?”据UP主“小虫哥_”介绍,为了模仿原神各个角色的声线,他使用了VITS语音合成模型。
这一模型的原理是上传声音文本,经过分析提取出语言特征,然后这些特征传入声学模型,由声学模型分析出声学特征,最后这些特征被发送给声码器,由声码器把相对应的声波发送出来。简单来说,声学模型保留了原神各个角色独特的声线。不考虑技术背景,通过向VITS模型“提供声音”,任何人都可以低成本创造专属自己的“声库”。

AI声音克隆已经不再是新鲜话题,一些AI配音工具如HeyGen、AI Dubbing等都可以免费体验,降低了普通用户的使用门槛。随着技术的升级,如何在内容和形式上做出别出心裁的作品,也许是创作者们当下更应该关注的问题。
0001
评论列表
共(0)条相关推荐
Alphabet 董事会成员:人工智能时代存在三种工作路径,其中一种注定会失败
站长之家(ChinaZ.com)12月11日消息:在最近的CNBCWorkSummit上,Alphabet董事会成员、前高盛首席财务官、首席信息官及全球证券联席负责人MartyChavez分享了他对人工智能发展的观点,并对工作者和企业如何在生成型AI时代适应提出了建议。0000何恺明与MIT合作推出自条件图像生成框架RCG
要点:何恺明与MIT合作推出的新自条件图像生成框架RCG在ImageNet-1K数据集上取得了无条件图像生成的新SOTA成绩,无需人类注释,保真且多样。RCG框架基于类似自监督学习的自条件生成方法,利用表示扩散模型RDM生成低维自监督图像表示,通过SSL图像编码器和MAGE像素生成器实现图像生成。RCG在ImageNet256×256上实现了3.56的FID和186.9的IS得分。站长网2023-12-08 17:09:180000没想到吧,原始部落野人都来直播带货了
直播带货真的包罗万象,没有你看不到的,只有你想不到的。有600万粉丝的探险博主这次把原始部落的“野人”带到了国内,整起了直播带货。一个原始人大哥(以下称小绿)脸上还涂了彩绘,另一个大哥(以下称猪牙哥)鼻孔里塞了两个野猪牙,还有一位大娘,除了衣服外,很有原始人感觉。这是在原始部落老家的大娘和猪牙哥。原始人当然不会中文了,看起来面对直播还略有拘谨。站长网2024-09-25 13:11:360000Stability AI 获得可转债支持 努力在高估值下筹集资金
据彭博社消息,知情人士透露,一直在努力以40亿美元的估值筹集资金的人工智能初创公司StabilityAI,从投资者那里获得了一笔可转换债券。站长网2023-06-29 15:59:410000