蚂蚁集团CodeFuse-VLM开源 支持多模态多任务预训练/微调
站长网2024-02-05 16:39:370阅
CodeFuse-VLM是一个支持多种视觉模型和语言大模型的框架,用户可以根据自己的需求搭配不同的Vision Encoder和LLM。
CodeFuse-VLM-14B模型在多个通用和代码任务上的性能超过LLAVA-1.5和Qwen-VL。
该框架还支持高效的PEFT微调,能有效提升微调训练速度并降低对资源的需求。
此外,CodeFuse-VLM还被用于训练网页图片到前端代码的多模态大模型,提高了前端工程师的开发效率。
CodeFuse-MFT-VLM 项目地址:
https://github.com/codefuse-ai/CodeFuse-MFT-VLM
CodeFuse-VLM-14B模型地址:
https://modelscope.cn/models/ss41979310/CodeFuse-VLM-14B/files
0000
评论列表
共(0)条相关推荐
人体气味分子可远距离吸引蚊子
新华社美国和赞比亚科研人员进行的一项实验显示,人体散发的气味分子可吸引蚊子从几十米外追踪而至,不同“配方”的气味对蚊子的吸引力大不相同。2007年3月14日,乌拉圭卫生工作人员在首都蒙得维的亚的一处公园辨认蚊子种类。图源:新华社站长网2023-05-24 01:34:040000Meta AI开源T2V模型AVID 可修复视频改变纹理
MetaAI最近开源了AVID,这是一项具有先进修复和扩展能力的T2V模型。AVID不仅支持通过文本编辑视频,还可以修复视频、更改视频对象、改变纹理和颜色,甚至删除视频内容或更换视频环境。项目地址:https://zhang-zx.github.io/AVID/这个开源项目是为了解决文本引导的视频修复所面临的三个主要挑战:时间一致性、不同保真度级别的支持以及处理可变的视频长度。站长网2023-12-12 10:48:430001小杨哥徒弟小黄回应近期改变:从给兄弟带来欢笑到全面思考
1月10日晚,小杨哥的徒弟“红绿灯的黄”在直播中分享了她的近期感悟。她表示,过去自己只想着给观众带来欢乐,而忽视了这种行为可能对年轻观众造成的影响。现在,她开始意识到自己的责任,并努力提升直播内容的品质。“红绿灯的黄”坦言,以前自己的思考方式较为狭隘,认为某些行为并无大碍。但现在,她开始全面地看待问题,努力优化自己的缺点,希望为观众提供更有价值的内容。0000中国高科集团与百度智能云合作 前者旗下应用引入文心大模型
近日,中国高科集团与百度智能云正式签署战略合作协议,双方将围绕“生成式大模型、公有云服务、产教融合”等方面开展深入合作,进一步推动人工智能前沿技术赋能。据介绍,中国高科集团和百度智能云此次合作将按照“生成式大模型、公有云服务、产教融合”三大方向展开。首先,在大模型方向,双方将基于文心大模型并结合高科集团自身业务展开生成式大模型深入合作,聚焦知识管理、智能客户、数字人直播、智能营销等方面。站长网2023-07-18 12:30:480000Stability AI一高管因版权争议辞职 反对公司未经许可使用版权作品
**划重点:**1.🚫StabilityAI高管辞职,指责公司认为可在培训产品时使用他人创作而不需许可。2.🤝AI公司主张“公平使用”,认为无需原创内容所有者的许可。3.🎼高管辞职者强调希望全球采取“需获得创作者许可”的伦理道路。站长网2023-11-17 17:14:590002