苹果推出降噪语言模型DLM 用于纠正ASR系统中的错误
站长网2024-05-28 19:16:062阅
苹果最近推出了一项新的技术创新,去噪语言模型(DLM),通过大量合成数据的训练,取得了超越以往的成就,实现了自动语音识别(ASR)领域的最新性能水平。
这项技术的核心在于使用文本转语音(TTS)系统创建音频,并将其输入ASR系统,通过这种方式产生了嘈杂的假设,与原始文本进行配对,从而训练DLM。该方法的关键要素包括升级的模型和数据、多说话人TTS系统、各种噪声增强策略以及新的解码技术。

研究显示,单个DLM可以应用于不同的ASR系统,其性能显著优于传统的基于语言模型(LM)的集束搜索重新评分方法。这一突破意味着精心设计的纠错模型可以取代传统的LM,将ASR系统的准确率提升到一个新的高度。尤其值得注意的是,DLM在LibriSpeech上实现了1.5%的字错误率(WER),这是不使用外部音频数据时报告的最佳数字之一,证明了其卓越性能。
然而,DLM面临的挑战之一是需要大量的监督训练示例,而这在典型的ASR数据集中是有限的。为了解决这一问题,DLM采用了使用TTS系统生成合成音频的方法,从而扩展了训练数据集的规模。这种创新性的做法为DLM的性能提升提供了更广阔的空间,使其在ASR领域引领潮流。
0002
评论列表
共(0)条相关推荐
打假、退网,时代不再需要大主播?
近日,李佳琦助播旺旺在综艺节目《我家那闺女》上展露了电商人背后的一面,凌晨1点半下播,2点半选品,4点准备提案,直到早上6点半才终于睡下。但没过几小时,旺旺又精神抖擞地出现在公司,开启新一天的工作。站长网2024-07-25 15:47:080001AI「复刻」现实女友爆火!国外小哥开源GirlfriendGPT,GitHub已获1.3k星
【新智元导读】GitHub上最近爆火的一个开源AI女友项目,教大家如何给自己的女友做一个分身。最近,国外一个开发者小哥EniasCailliau又整了个活——他把现实中自己的女朋友通过技术搞了个AI克隆出来。项目放到GitHub上没几天,就收获了1.3k的星星。不得不说,城会玩儿。克隆女友——Sacha站长网2023-06-02 11:58:540000Zoom投资AI初创公司Anthropic 集成Claude AI助手
据外媒报道,Zoom正全力加大投入生成式人工智能。在3月份宣布与OpenAI建立合作伙伴关系后,这家企业通信公司正在与AI初创公司Anthropic合作,将Anthropic的ClaudeAI助手集成到Zoom的生产力平台中。该公司还通过其全球投资部门对Anthropic进行了一笔未公开金额的投资。站长网2023-05-17 10:20:020000AI视频编辑方法ReVideo:可局部修改视频内容和运动轨迹
划重点:🔍在现有的视频生成和编辑方法中,精确和局部的视频编辑仍然是一个巨大的挑战。🔍本文提出了一种新颖的方法,通过同时指定内容和运动来实现精确的视频编辑。🔍通过三阶段的训练策略和时空自适应融合模块,我们实现了内容和运动控制的集成,具有出色的编辑效果。站长网2024-05-24 21:14:300000国内免费AI编程助手通义灵码:AI人工智能写代码 开发效率提升10倍
对于很多开发者来说,已经开始借助AI智能编码助手提升自己的开发效率。本文为大家分享一款国内好用的AI编程工具通义灵码。据官方介绍,通义灵码是国内用户规模第一的智能编码助手,基于SOTA水准的通义千问代码模型Code-Qwen1.5研发,插件下载量已超350万。体验地址:https://top.aibase.com/tool/tongyilingma站长网2024-05-24 18:28:430000