登陆注册

开源音频模型Stable

  • 开源音频模型Stable Audio Open,文本生成47秒高清音效

    6月6日,著名开源大模型平台Stability.ai在官网宣布,开源最新文生音频模型StableAudioOpen。用户通过文本就能生成最多47秒,钢琴、笛子、鼓点、模拟人声等不同类型的44.1kHz音效。值得一提的是,StableAudioOpen支持数据微调,歌手、音乐人可以让其生成基于自己的音乐数据,例如,架子鼓手可以根据自己的鼓点来进行微调。
    站长网2024-06-06 17:42:59
    0000