登陆注册

擅长处理文本密集图像

  • 多模态大模型KOSMOS-2.5 擅长处理文本密集图像

    随着视觉与语言的深度融合,文本图像理解成为多模态领域的新方向。文章介绍了一个突破性的多模态模型KOSMOS-2.5,它在处理文本密集图像上展现强大能力。论文地址:https://arxiv.org/abs/2309.11419
    站长网2023-09-28 10:39:20
    0000