微软推出语音合成模型NaturalSpeech 2 只需几秒提示语音即可定制语音
站长网2023-07-27 14:22:090阅
微软 AI 团队推出 NaturalSpeech2,一款采用潜在扩散模型的先进文本到语音系统,具备强大的零样本语音合成和增强表达力的韵律功能。该系统可用于语音合成和唱歌合成,为用户提供高质量、多样化的语音合成体验。
NaturalSpeech2是一种 TTS 系统,通过潜在扩散模型生成富有表达力的韵律、良好的韧性,并且最关键的是具备强大的零样本能力,能够进行语音合成。
项目地址:https://speechresearch.github.io/naturalspeech2/
与传统的 TTS 系统不同,NaturalSpeech2使用连续向量而不是离散的标记来表示语音,从而提供了更准确的语音重构。
NaturalSpeech2通过使用大规模数据集进行训练,展示了其在零样本情况下生成具有不同说话人身份、韵律和风格(如唱歌)的语音的能力。
实验结果表明,NaturalSpeech2在零样本条件下生成的语音与语音提示和真实语音的韵律更加相似,并且在 LibriTTS 和 VCTK 测试集上的自然度(以 CMOS 为度量)与真实语音相当或更好。
它还可以通过一个简短的唱歌提示或仅有的语音提示来生成具有新音色的唱歌声,实现了真正的零样本唱歌合成。
0000
评论列表
共(0)条相关推荐
英特尔为 Arrow Lake-S 和 Lunar Lake CPU 添加人工智能和机器学习指令集
英特尔对下一代ArrowLake-S和LunarLake系列的指令支持进行了更新,验证了对几个新指令的支持。根据英特尔发布的《架构指令集扩展和未来特性》文档,即将推出的ArrowLake和LunarLakeCPU系列将提供对指令的广泛支持。该文档揭示了专注于人工智能任务的AVX-VNNI-INT16.SHA512.SM3和SM4指令。站长网2023-07-05 09:17:190001余承东升任华为车BU董事长 靳玉志任CEO
9月21日消息,日前,有消息称,华为光产品线总裁靳玉志已于近期接任智能汽车解决方案BUCEO一职,而余承东担任智能汽车解决方案BU董事长一职。据第一财经报道,华为知情人士称上述消息属实。该人士表示,此次调整,余承东将升任汽车BU董事长,整体是要帮助华为在智能汽车领域获得商业成功。“未来将持续加大对汽车相关领域的业务投入。”据了解,华为内部也对上述调整进行了内部正式发文。0000豪掷290亿元!马斯克:特斯拉今年要买大量NVIDIA芯片
快科技6月5日消息,特斯拉CEO埃隆马斯克近日透露,特斯拉计划在今年投入高达40亿美元(约合人民币290亿元)用于采购NVIDIA芯片。马斯克在社交媒体上表示,特斯拉今年的人工智能相关支出大约为100亿美元,其中约一半将用于内部研发,包括特斯拉自行设计的AI推理计算机和传感器,以及Dojo超级计算机集群的建设。他进一步解释说,构建AI训练超级集群的成本中,NVIDIA硬件占据了大约三分之二。0000京东:618将把AI数字人直播技术免费开放给商家使用
在2024年京东618商家生态伙伴大会中,京东集团CEO许冉宣布了今年京东618的重要战略部署。她明确表示,京东将集中最大力度的资源,全力投入到流量生态、AI技术和服务能力这三个核心领域,力求在即将到来的大促活动中取得卓越成绩。站长网2024-04-18 20:47:460001雷军兑现承诺直播时打开礼物功能:网友疯狂刷屏送礼
快科技5月18日消息,早上8:30,雷军如约再次进行了线上直播,此次他亲自驾驶一台小米SU7Pro,由上海世纪大道附近开往杭州,途中展示了小米城市领航NOA功能,此次也是小米SU7Pro首次公开亮相。值得一提的是,雷军在上次直播时并没有打开礼物功能、也没有进行带货,被当时的网友吐槽”说浪费了泼天的流量”。站长网2024-05-18 10:08:170000