智源研究院推出新一代多模态小模型Bunny-3B
站长网2024-02-23 09:55:223阅
智源研究院近期提出了一项新技术,通过数据浓缩技术获得高质量训练数据,从而提升多模态小模型的性能。
具体来说,他们将 LAION-2B 压缩成2M 核心集,得到更丰富的预训练数据,同时精选数据集进行指令微调,训练出性能强劲的小模型。这一技术路线带来了新一代多模态小模型 Bunny 系列,其中 Bunny-3B 表现出色,在多个基准上超越了其他近期热门模型,与大模型相媲美。
Bunny 模型采用经典的 Encoder Projector LLM 架构,支持多种 Vision Encoders 和 LLM Backbone,提供可扩展的组合框架。在各类多模态模型评估中,Bunny 表现优异,甚至在一些指标上超越了13B 大模型。该技术的关键在于数据驱动的多模态模型研究,为多模态大模型轻量化提供了新思路和工具。
总的来说,通过数据浓缩技术获得高质量训练数据,Bunny 系列小模型在多模态任务上表现优异,将促进大模型技术的发展和普及。
项目地址:https://github.com/BAAI-DCAI/Bunny
模型下载地址:https://huggingface.co/BAAI/bunny-phi-2-siglip-lora
在线Demo:https://bunny.dataoptim.org
0003
评论列表
共(0)条相关推荐
心理医生使用AI制作儿童深度伪造色情图像被判入狱
划重点:🔍北卡罗来纳州的一名儿童精神病学家被判入狱,因为他使用人工智能软件制作儿童深度伪造色情图像。🔍该儿童精神病学家被控使用网络的人工智能软件,对患者进行秘密录音并制作非法图像和视频。🔍检察官表示,这种利用技术伤害儿童的行为是邪恶的,该儿童精神病学家被判处40年监禁和30年监管释放。站长网2023-11-10 09:51:360000SettleMint 的 AI 助手旨在帮助 web3 开发人员编写更好的智能合约
SettleMint是一个面向企业的低代码区块链编程工具,最近在其平台上添加了AI助手。该AI助手旨在帮助开发人员创建智能合约、集成数据并增强质量保证(QA)测试。人工智能可以帮助Draft智能合约,并解释每一行代码的作用。尽管数字货币价格暴跌,但这家成立七年的比利时公司的用户仍在稳步增长,因为越来越多的企业认识到区块链技术的好处,但缺乏将其想法变为现实的技术技能。站长网2023-08-03 14:47:530000微软工程师向美国官员和公司董事会发警告:AI图像生成器存在潜在风险
**划重点:**1.🤖微软工程师发警报:公司的人工智能图像生成器工具可能轻易生成冒犯和有害图像。2.📄工程师致信美国监管机构和微软董事会,敦促采取行动,揭示产品安全隐患。3.🌐问题源于Designer工具,可能生成包含不当内容的图像,引发安全和道德争议。站长网2024-03-07 15:18:420000格力发布618战报:销售额90亿 不足“老对手”小米的一半
快科技6月20日消息,618电商大促刚刚过去,很多厂商都公布了自家的战报,格力电器今天宣布全网累计销售额破90亿。从官方公布的各项数据来说,格力可以说是大获全胜,比如天猫618全周期全品类销售额同比增长了40%、抖音618大家电店铺TOP1、抖音空调行业全周期累计销售额No.1等等。需要注意的是,这个成绩与老对手小米”的成绩却相差甚远。站长网2023-06-21 14:36:180000百度百家号推出「智能笔记」功能 支持AI改写每天5次机会
近日,百度百家号宣布AIGC创作平台升级,并推出「智能笔记」功能,支持不同文风的改写和润色。「智能笔记」功能可生成多种风格的内容,包括好物推荐、旅游攻略、知识科普、营销方案、AI写诗等。需要注意的是,「智能笔记」中的「AI改写」功能,限时免费体验,每天5次AI改写机会,最多支持输入800个字进行改写,有活泼、营销、专业三种风格可选。如正文超过50字,还可用AI生成标题。站长网2023-04-17 09:17:540000