登陆注册

SeamlessM4T

  • Meta 发布多语言语音翻译模型 SeamlessM4T:可翻译多达 100 种语言、语音或文本

    周二,Meta宣布推出SeamlessM4T,一种用于语音和文本翻译的多模态人工智能模型。作为一种能够处理文本和音频的神经网络,它可以执行文本到语音、语音到文本、语音到语音和文本到文本的翻译,支持「最多100种语言」,Meta表示,它的目标是帮助说不同语言的人更有效地交流。图片来自Meta
    站长网2023-08-23 16:26:55
    0000
  • Meta推出多模态语音翻译模型 SeamlessM4T 可转录翻译近百种语言

    Meta发布了一种多模态语音翻译模型SeamlessM4T,可以无缝地在语音和文本之间进行翻译和转录。该模型支持近100种语言的自动语音识别、语音到文本翻译、语音到语音翻译、文本到文本翻译以及文本到语音翻译等任务。为了支持这个模型的发展,Meta还发布了SeamlessAlign的元数据,包含了27万小时的语音和文本对齐数据。
    站长网2023-08-23 12:45:28
    0000