微软推出语音合成模型NaturalSpeech 2 只需几秒提示语音即可定制语音
站长网2023-07-27 14:22:090阅
微软 AI 团队推出 NaturalSpeech2,一款采用潜在扩散模型的先进文本到语音系统,具备强大的零样本语音合成和增强表达力的韵律功能。该系统可用于语音合成和唱歌合成,为用户提供高质量、多样化的语音合成体验。
NaturalSpeech2是一种 TTS 系统,通过潜在扩散模型生成富有表达力的韵律、良好的韧性,并且最关键的是具备强大的零样本能力,能够进行语音合成。

项目地址:https://speechresearch.github.io/naturalspeech2/
与传统的 TTS 系统不同,NaturalSpeech2使用连续向量而不是离散的标记来表示语音,从而提供了更准确的语音重构。
NaturalSpeech2通过使用大规模数据集进行训练,展示了其在零样本情况下生成具有不同说话人身份、韵律和风格(如唱歌)的语音的能力。
实验结果表明,NaturalSpeech2在零样本条件下生成的语音与语音提示和真实语音的韵律更加相似,并且在 LibriTTS 和 VCTK 测试集上的自然度(以 CMOS 为度量)与真实语音相当或更好。
它还可以通过一个简短的唱歌提示或仅有的语音提示来生成具有新音色的唱歌声,实现了真正的零样本唱歌合成。
0000
评论列表
共(0)条相关推荐
首批搭载M3芯片Mac或年底上市 核心数可能增至12个
苹果从英特尔芯片转向自己的自研芯片已经有一段时间了。这意味着我们即将看到更强大、更成熟的苹果芯片问世,而M3系列芯片将是这一过程的开端。现在但我们现在有了一些关于M3Pro的信息。在马克·格尔曼最新的PowerOn新闻简报中,他说,苹果目前正在测试一款搭载M3Pro的MacBookPro。这个版本似乎比你现在可以在MacBookPro型号中买到的M2Pro要强大得多。站长网2023-05-15 10:32:570001特斯拉Cybertruck全国巡展1月28日开启 定名赛博越野旅行车
站长之家(ChinaZ.com)1月26日消息:近日,特斯拉Cybertruck在中国正式定名为“赛博越野旅行车”,这一名称的公布引起了广泛关注。此外,特斯拉还宣布将于1月28日在全国范围内启动Cybertruck巡展活动,届时将在上海、北京、深圳、成都、南京、杭州、西安和重庆等8个城市同步亮相。站长网2024-01-26 10:25:130000抖音,600亿小游戏的“卖铲人”
小游戏,再度出圈。2024年5月,《抓大鹅》成为最受欢迎的小游戏,也是《跳一跳》《羊了个羊》《合成大西瓜》之后又一匹“黑马”。与此同时,小游戏成为上市游戏公司2023年报以及2024年Q1季报的“关键词”,行业有头有脸的玩家纷纷摩拳擦掌准备大干一场。挖掘小游戏这座“富矿”,未来谁能赚得盆满钵满尚没有定论,但提供平台的“卖铲人”却无疑是大赢家。毕竟,没有小游戏能拒绝抖音。站长网2024-05-17 16:44:100000巨头“拾荒”元宇宙
科技语境从来没有永恒的主角,无论是技术、概念,还是故事,都在随着时代变换不停流转,如同不息涌动的浪潮,塑造着时代的脉络,将人们卷入其中。而在诸多造势神话里,元宇宙的故事最令人意难平。“绿洲”、虚实破界、人格的重生,元宇宙几乎勾勒出了人们对未来娱乐形态的全部想象,可对“一眼望到头”的元宇宙而言,尽管尽头的景致甚美,但旅途过程却十分痛苦:站长网2023-09-25 14:26:480001微软首席科学家反对马斯克呼吁禁止人工智能的公开信 称其为模糊不清的要求
站长网2023-05-04 09:05:260000