Hugging Face研究人员推语音识别模型Distil-Whisper 速度提高、参数减少
划重点:
⦁ Hugging Face研究人员利用伪标记创建了一个庞大的开源数据集,用于提炼Whisper模型的较小版本,称为Distil-Whisper。
⦁ Distil-Whisper在挑战性的声学条件下保持了Whisper模型的韧性,同时减轻了长篇音频中的错觉错误。
⦁ 自动语音识别(ASR)系统已达到人类水平的准确度,但由于预训练模型的不断增大,在资源受限的环境中面临挑战。
Hugging Face研究人员最近解决了在资源受限环境中部署大型预训练语音识别模型的问题。他们通过创建一个庞大的开源数据集,使用伪标记的方法,提炼出了Whisper模型的较小版本,称为Distil-Whisper。
图源备注:图片由AI生成,图片授权服务商Midjourney
Whisper语音识别变压器模型是在68万小时的嘈杂互联网语音数据上进行了预训练。它包括基于变压器的编码器和解码器组件,在零调优的情况下取得了竞争激烈的结果。而Distil-Whisper是通过使用伪标记进行知识提炼得到的紧凑版本。
Distil-Whisper在挑战性的声学条件下保持了Whisper模型的韧性,同时减轻了长篇音频中的错觉错误。这项研究引入了一种针对语音数据的大规模伪标记方法,这是一个尚未充分开发但颇具前景的知识提炼途径。
自动语音识别(ASR)系统已经达到了人类水平的准确度,但由于预训练模型的不断增大,在资源受限的环境中面临挑战。Whisper作为一个大型预训练ASR模型,在各种数据集上表现出色,但在低延迟部署方面可能更实用。而知识提炼在压缩自然语言处理变压器模型方面已经得到了有效应用,但在语音识别中的运用尚未得到充分探讨。
与原始 Whisper 模型相比,源自知识蒸馏的 Distil-Whisper 显着提高了速度并减少了参数,同时在具有挑战性的声学条件下保持了弹性。它的加速速度提高了5.8倍,参数减少了51%,在零样本场景下的分布外测试数据上实现了不到1% 的 WER。distil-medium.en 模型的 WER 稍高,但直接推理能力提高了6.8倍,模型压缩率提高了75%。Whisper 模型在长格式音频转录中容易出现幻觉错误,而 Distil-Whisper 可以减轻这些错误,同时保持有竞争力的 WER 性能。
Distil-Whisper 是通过知识蒸馏实现的 Whisper 模型的紧凑变体。这种创新方法在速度和参数减少方面产生了显着的好处,与原始 Whisper 模型相比,Distil-Whisper 速度更快,参数更少。尽管 WER 稍高,但 distil-medium.en 模型提供了更直接的推理和实质性的模型压缩。
项目网址:https://github.com/huggingface/distil-whisper
对标GPTs但没有创建门槛,应用层的AI Agent玩家终于来了
从此在钉钉上,你只需要给出指令,其他事情交给「AI助理」来办就可以了。2024开年伊始,大厂便开始卷AIAgent了。过去一年,人工智能行业的风向标不断发生变化,最开始备受关注的是如雨后春笋般涌现的大语言模型及AIGC应用,接着又出现很多基于大语言模型打造的AI辅助应用(如微软*)。如今AIAgent成为激烈角逐点,是AIGC下一阶段的关键。站长网2024-01-10 09:31:160000LQ-LoRA:通过低秩量化矩阵分解实现高效的语言模型微调
要点:LQ-LoRA是一种基于LoRA的变体,通过低秩量化矩阵分解实现对大型语言模型进行高效微调,特别适用于解决内存效率和数据适应性问题。LQ-LoRA通过在适应过程中将权重矩阵分解为量化组件Q和低秩组件L1L2,结合整数线性规划技术,提高了LoRA的内存效率。该方法在调整后能够显著降低大型语言模型的内存需求,同时保持功能性。站长网2023-11-27 10:22:510001极越汽车:全球首台AI汽车机器人“极越01” 9 月 19 日 开启预订
极越汽车宣布,将推出全球首台AI汽车机器人——极越01,并将于9月19日15:00正式首发亮相并开启限时预订。据官方透露,极越01将成为中国首发高通骁龙8295智舱芯片的车型。这款车前身为集度ROBO-01概念车,车内配备了一块35.6英寸一体式屏幕。站长网2023-09-18 08:45:030000暴雪中国回应国服回归:目前没有可以分享的信息
昨日有媒体报道称,暴雪正在与国内多家游戏厂商洽谈“国服回归”事宜,并最终选择了与网易重新牵手合作。此前,暴雪与网易的授权协议到期后,于2023年1月24日起暂停了在中国大陆的大部分游戏服务。对于这一合作,暴雪中国表示目前没有可以分享的信息或更新。0000doge表情包柴犬去世 生前患有白血病和肝病
据外媒报道,著名表情包doge的原型柴犬Kabosu去世。Doge的原型是一只名叫Kabosu的日本柴犬,由日本幼儿园老师AtsukoSato在2008年收养。站长网2024-05-24 18:09:130000