智源研究院推出新一代多模态小模型Bunny-3B
站长网2024-02-23 09:55:224阅
智源研究院近期提出了一项新技术,通过数据浓缩技术获得高质量训练数据,从而提升多模态小模型的性能。
具体来说,他们将 LAION-2B 压缩成2M 核心集,得到更丰富的预训练数据,同时精选数据集进行指令微调,训练出性能强劲的小模型。这一技术路线带来了新一代多模态小模型 Bunny 系列,其中 Bunny-3B 表现出色,在多个基准上超越了其他近期热门模型,与大模型相媲美。
Bunny 模型采用经典的 Encoder Projector LLM 架构,支持多种 Vision Encoders 和 LLM Backbone,提供可扩展的组合框架。在各类多模态模型评估中,Bunny 表现优异,甚至在一些指标上超越了13B 大模型。该技术的关键在于数据驱动的多模态模型研究,为多模态大模型轻量化提供了新思路和工具。
总的来说,通过数据浓缩技术获得高质量训练数据,Bunny 系列小模型在多模态任务上表现优异,将促进大模型技术的发展和普及。
项目地址:https://github.com/BAAI-DCAI/Bunny
模型下载地址:https://huggingface.co/BAAI/bunny-phi-2-siglip-lora
在线Demo:https://bunny.dataoptim.org
0004
评论列表
共(0)条相关推荐
大麦开通候补功能 官方回应:适用于部分演出
大麦网官方公告表示,将于今日上线一项新的功能,名为演唱会回流门票候补。此项功能允许用户在演出售罄并且满足平台候补条件(仅限于支持条件退款的电子票演出)时,选择预付全款来候补门票。一旦该项目有新增库存,系统将优先为候补订单进行匹配抢票。站长网2023-11-06 17:26:300000iPad Pro/Air双剑齐发!苹果发布会仅35分钟
快科技5月6日消息,据爆料人MarkGurman透露,苹果将于5月7日举行的发布会预计仅持续35分钟,届时将推出4款新品:iPadPro、iPadAir、ApplePencil和妙控键盘。其中新款iPadPro将提供11英寸和12.9英寸两种尺寸,首次采用OLED屏幕,支持LTPO技术和120HzProMotion显示,采用双串联结构,具有高亮度、长寿命和更好的电池续航表现。站长网2024-05-06 10:54:540000打电话还有烟花!中国联通XR通话来了:小米、华为等手机完成测试
快科技10月23日消息,中国联通今日宣布,已成功完成XR通话测试。本次XR通话测试由各方专家在31个省全面展开的大规模端网测试。已完成对小米、OPPO、VIVO、华为、荣耀5个终端厂家32款主流手机的测试,涵盖XR通话的主要功能。据了解,XR通话是指在用户通话时,为其提供的音视频服务。0000iPhone17或将移除Plus机型:Slim将专注于创新工业设计
根据分析师郭明錤的最新信息,苹果公司可能在iPhone17系列中取消Plus机型,转而推出一款全新设计的iPhone17Slim。站长网2024-07-25 15:29:500000苹果计划在云端使用 M2 Ultra 芯片j进军人工智能领域
近日,苹果公司宣布了一项重大计划,他们计划通过将复杂的查询卸载到数据中心运行的M2Ultra芯片上,并转向更先进的M4芯片,开始进军生成式人工智能领域。站长网2024-05-10 11:29:410000