登陆注册

支持多模态多任务预训练

  • 蚂蚁集团CodeFuse-VLM开源 支持多模态多任务预训练/微调

    CodeFuse-VLM是一个支持多种视觉模型和语言大模型的框架,用户可以根据自己的需求搭配不同的VisionEncoder和LLM。CodeFuse-VLM-14B模型在多个通用和代码任务上的性能超过LLAVA-1.5和Qwen-VL。该框架还支持高效的PEFT微调,能有效提升微调训练速度并降低对资源的需求。
    站长网2024-02-05 16:39:37
    0000