微软推出语音合成模型 NaturalSpeech2
站长网2023-07-28 10:55:032阅
微软最近推出了一个名为NaturalSpeech2的语音模型。这个模型采用了“潜在扩散”式设计,在零样本语音合成方面表现非常出色。微软声称这个模型提供了“商业级”的语音/歌唱解决方案,可以为用户提供高质量、多样化的语音合成体验。
与传统的语音转文字(TTS)系统不同,微软的NaturalSpeech2使用“连续向量”取代“离散标记”来表示语音,从而生成更完整的语音片段。这样做的优点是不会产生“缺乏感情”的“棒读”现象,即一字一顿地讲话。
实验结果表明,NaturalSpeech2在零样本条件下生成的语音与语音提示和真实语音的韵律非常接近,并且在LibriTTS和VCTK测试集上的自然度(以CMOS为度量)与真人语音难以区分。
因此,NaturalSpeech2是一个非常强大的语音合成工具,可以广泛应用于各种应用,如语音助手、智能客服、虚拟歌手等。它的推出将推动语音合成技术的发展,为用户提供更加智能、自然的语音交互体验。
论文链接:
https://arxiv.org/abs/2304.09116
项目演示:
https://speechresearch.github.io/naturalspeech2/
0002
评论列表
共(0)条相关推荐
私域要赚钱,就多发朋友圈!
各位村民好,我是村长要赚钱,还得发朋友圈。尽管很多人吐槽,现在朋友圈好看的内容少了,广告多了,自己都不想看了。但站在商家、博主、群主等角度,千万不能这么想。01用户多、限制小根据微信朋友圈广告的数据显示,朋友圈月活量12亿,日活量7.5亿,这是目前国内已知日活最高的内容平台了。而相比于抖音、小红书、知乎等内容平台动辄就说你涉嫌广告营销封号、禁言,你在自己朋友圈打广告的限制是最少的。0000滴滴:女乘客可选女司机、拉黑异味车等成用户最期望功能
滴滴公众评议会为期一周的投票结束,共有75847人参与投票,1908人评论留言。女乘客可选女司机、拉黑异味车、宠物快车三个功能位列用户投票前三。针对以上用户投票选出的期望功能,滴滴将尽快制定产品方案,并陆续邀请用户内测试行。站长网2024-07-04 10:07:060000百度与亿咖通科技合作 文心大模型智舱将在领克及smart落地
8月2日,百度Apollo宣布长城汽车、亿咖通科技(排名不分先后)成为首批文心大模型智舱应用探索伙伴。百度Apollo已分别与长城汽车、亿咖通科技基于大模型能力围绕车载交互场景开展探索和实践,完成多项创新功能在量产车型平台上的验证,部分功能未来有望在长城、领克、smart等量产车型上率先落地。站长网2023-08-02 13:59:380002特斯拉Model 3、Model Y 长续航版涨价 后者价格上调2500元
特斯拉中国宣布,Model3长续航版和ModelY长续航版的售价将进行调整。具体来说,ModelY全轮驱动长续航版的售价将从原先的29.99万元调整为30.24万元,上涨了2500元。同时,Model3长续航焕新版的售价也将从原先的29.59万元调整为29.74万元,上调了1500元。站长网2023-11-09 08:39:130000remove bg最强平替?新背景分割开源模型RMBG v1.4来了
RMBGv1.4是一个新的背景分割开源模型,最近引起了广泛的关注。这个模型的效果非常出色,让人感觉与目前市面上顶尖产品removebg的效果不相上下。模型下载地址:https://top.aibase.com/tool/rmbg-v1-4站长网2024-02-07 10:03:170004