首页站长资讯Meta发布机器学习模型Voicebox：可从文本生成语音精通六门语言

Meta发布机器学习模型Voicebox：可从文本生成语音精通六门语言

站长网2023-06-20 17:10:321阅

日前，Meta平台的人工智能研究部门推出了名为Voicebox的机器学习模型，可以将文本转换为语音。

与其他文本转语音模型不同的是，Voicebox能够执行许多未经过训练的任务，包括编辑、去除噪音和样式转换。

为训练模型，Meta的研究人员使用了一种名为“ “Flow Matching” ”的方法，该方法比其他生成模型中使用的扩散学习方法更高效和通用。由于担心滥用，Meta并没有发布Voicebox，以及将来可以支持很多应用。

Voicebox是一种生成模型，可以在英语、法语、西班牙语、德语、波兰语和葡萄牙语等六种语言中合成语音。它通过学习将语音音频样本映射到其转录本的模式来进行训练，从而可以用于许多下游任务。

与特定应用程序训练的生成模型不同，Voicebox在训练过程中使用文本作为训练目标，训练过程中，模型会预测语音片段，中间部分被屏蔽，根据周围的音频和文本转录本进行推理学习，学习使用文本生成自然语言语音。

Voicebox的一个有趣应用是语音采样。该模型可以从单个文本序列中生成各种语音样本。这种能力可用于生成合成数据来训练其他语音处理模型。“我们的结果表明，在Voicebox生成的合成语音上训练的语音识别模型的性能几乎与在真实语音上训练的模型一样好，错误率下降了1%，而在以前的文本到语音模型中，合成语音的错误率下降了45%到70%，”Meta写道。

不过Voicebox也有一定限制。由于它已经过有声读物数据的训练，因此它不能很好地转移到随意且包含非语言声音的对话语音中。它也不能完全控制生成的语音的不同属性，例如语音风格、语气、情感和声学条件。Meta团队还在探索技术来克服这些限制。

官方介绍网址:https://ai.facebook.com/blog/voicebox-generative-ai-model-speech/

Meta发布机器学习模型Voicebox可从文本生成语音精通六门语言

0001

评论列表

共(0)条

相关推荐

站长资讯
小冰公司推出AI数字员工“0元定制” 大模型小样本技术实现声音复刻
小冰公司宣布推出“0元定制计划”，为10000家符合条件的中小企业、领域达人及个体经营者，免费创建自己的AI数字员工，支持高拟真、低门槛、零成本的形象及声音复刻。据悉，目前，小冰小样本AI数字员工只面向企业开放。升级后的AI数字员工能进行语音和文本实时交互，有多种对话模式，可在网页（PC端移动端）、公众号、APP、直播间、VoIP、线下装置落地，几乎覆盖了企业全部应用场景。
站长网2023-04-21 14:59:22
0000
站长资讯
OpenAI 加强安全团队并赋予董事会对高风险人工智能的否决权
OpenAI正在扩展其内部安全流程，以抵御有害人工智能的威胁。公司新成立的「安全咨询小组」将位于技术团队之上，向领导层提出建议，董事会也被授予否决权——当然，他们是否会实际使用这一权力则是另一个问题。
站长网2023-12-19 09:08:49
0001
站长资讯
华为 Pocket 2 折叠屏手机发布采用玄武水滴铰链设计
在今日的华为Pocket2时尚盛典上，华为常务董事、终端BGCEO、智能汽车解决方案BU董事长余承东发表了精彩演讲。余承东在演讲中详细介绍了华为Pocket2的卓越特性。它采用了玄武水滴铰链设计，使手机的平整度提升了62%，甚至可以与直板机相媲美。同时，这款手机还采用了超强火箭钢材质，强度提升20%，抗跌能力提升112%，并支持2米IPX8级抗水，为用户提供了更加稳固和安全的使用体验。
站长网2024-02-22 15:17:38
0000
站长资讯
亚马逊CEO：每个业务部门都有多个生成式AI计划正在进行中
亚马逊的首席执行官AndyJassy在公司的季度财报电话会议上透露，人工智能是他们未来计划的核心。Jassy表示，亚马逊内部的每个业务部门都有多个正在进行中的A.I.项目。这包括他们的零售店、在线广告、流媒体娱乐、云服务和消费电子产品，特别是他们的虚拟助手Alexa。
站长网2023-08-04 14:31:34
0000
站长资讯
京东许冉：研发投入累计超1000亿大模型将应用于多个场景
在2023年世界互联网大会乌镇峰会上，京东集团首席执行官许冉在互联网企业家论坛上发表演讲，阐述了京东以供应链为基础的新型实体企业的发展理念。她强调了数字技术与实体经济深度融合对于创新的重要推动作用，并介绍了京东在技术创新方面的成果和经验。
站长网2023-11-09 10:41:25
0000