登陆注册

支持还原图片ID

  • 百度推多模态模型UNIMO-G 支持还原图片ID

    核心要点:百度提出了UNIMO-G统一图像生成框架,通过多模态条件扩散实现文本到图像生成,克服了文本描述简洁性对生成复杂细节图像的挑战。UNIMO-G包含多模态大语言模型(MLLM)和基于编码的多模态输入生成图像的条件去噪扩散网络两个核心组件,通过两阶段训练策略达到统一的图像生成能力。
    站长网2024-01-26 11:00:07
    0000