登陆注册

只需提供文本即可生成高质量音频

  • 开源声音与音乐生成模型AudioLDM2 只需提供文本即可生成高质量音频

    最近,一款优秀的开源声音与音乐生成模型AudioLDM2在GitHub上引起了关注。这个模型的运行速度很快,可以生成节奏、音效和基本对话。它操作简单,并具有强大的提示样式鲁棒性。该模型采用了先进的隐式扩散模型AudioLDM,可以生成高质量的音频。用户只需要提供文本描述,就可以让模型自动生成对应的音频。项目地址:https://github.com/haoheliu/AudioLDM2
    站长网2023-08-30 10:40:44
    0001