登陆注册

革新视听语音分离

  • 清华大学团队推出RTFS-Net:革新视听语音分离,百万参数实现高效性能

    **划重点:**1.🎙️RTFS-Net是首个采用少于100万个参数的视听语音分离方法,通过压缩-重建策略显著减少计算复杂度。2.🌐针对传统视听语音分离方法的问题,RTFS-Net创新性地解决了时域和时频域方法的挑战,提高了在复杂环境中的性能。3.🚀在三个基准多模态语音分离数据集上,RTFS-Net在大幅降低模型参数和计算复杂度的同时,接近或超越了当前最先进的性能。
    站长网2024-03-06 17:46:32
    0002