登陆注册

文字与图像同步创作的开源工具

  • DreamLLM:文字与图像同步创作的开源工具

    DreamLLM是一款强大的多模态大型语言模型(LLM)学习框架,它首次实现了多模态理解和创作之间常常被忽视的协同效应。DreamLLM基于两个基本原则运作。首先,它侧重于在原始多模态空间中直接采样,生成语言和图像后验的生成模型。这一方法规避了外部特征提取器如CLIP所固有的限制和信息损失,实现了更全面的多模态理解。项目地址:https://dreamllm.github.io/
    站长网2023-09-25 17:35:13
    0000