登陆注册
19125

智源研究院推出新一代多模态小模型Bunny-3B

站长网2024-02-23 09:55:224

智源研究院近期提出了一项新技术,通过数据浓缩技术获得高质量训练数据,从而提升多模态小模型的性能。

具体来说,他们将 LAION-2B 压缩成2M 核心集,得到更丰富的预训练数据,同时精选数据集进行指令微调,训练出性能强劲的小模型。这一技术路线带来了新一代多模态小模型 Bunny 系列,其中 Bunny-3B 表现出色,在多个基准上超越了其他近期热门模型,与大模型相媲美。

Bunny 模型采用经典的 Encoder Projector LLM 架构,支持多种 Vision Encoders 和 LLM Backbone,提供可扩展的组合框架。在各类多模态模型评估中,Bunny 表现优异,甚至在一些指标上超越了13B 大模型。该技术的关键在于数据驱动的多模态模型研究,为多模态大模型轻量化提供了新思路和工具。

总的来说,通过数据浓缩技术获得高质量训练数据,Bunny 系列小模型在多模态任务上表现优异,将促进大模型技术的发展和普及。

项目地址:https://github.com/BAAI-DCAI/Bunny

模型下载地址:https://huggingface.co/BAAI/bunny-phi-2-siglip-lora

在线Demo:https://bunny.dataoptim.org

0004
评论列表
共(0)条