登陆注册

视觉

  • 任意文本、视觉、音频混合生成,多模态有了强大的基础引擎CoDi-2

    研究者表示,CoDi-2标志着在开发全面的多模态基础模型领域取得了重大突破。今年5月,北卡罗来纳大学教堂山分校、微软提出一种可组合扩散(ComposableDiffusion,简称CoDi)模型,让一种模型统一多种模态成为可能。CoDi不仅支持从单模态到单模态的生成,还能接收多个条件输入以及多模态联合生成。
    站长网站长资讯2023-12-04 09:49:08
    0000