登陆注册

比OpenAI的Whisper更好

  • 阿里开源新语音模型,比OpenAI的Whisper更好

    阿里巴巴在Qwen-Audio基础之上,开源了最新语音模型Qwen2-Audio。Qwen2-Audio一共有基础和指令微调两个版本,支持使用语音向音频模型进行提问并识别内容以及语音分析。例如,让一位女生说一段话,然后识别她的年纪或解读她的心情;发布一段吵闹的声音,分析有哪些声音组成等。
    站长网2024-08-10 18:02:28
    0000