阿里云开源通义千问视觉语言模型Qwen-VL 具备多模态信息理解能力
站长网2023-08-26 17:01:230阅
阿里云旗下魔搭社区(ModelScope)宣布开源视觉语言模型Qwen-VL。
据介绍,Qwen-VL以通义千问70亿参数模型Qwen-7B为基座语言模型研发,支持图文输入,具备多模态信息理解能力。
相比之前的模型,Qwen-VL 新增了视觉定位、图像中文字理解等功能,可以接受图像和多语言文本作为输入,并输出图像或文本。
目前,该模型在魔搭社区上线,开源了 Qwen-VL 和 Qwen-VL-Chat 两个模型。
Qwen-VL-Chat 可以用于快速搭建具备多模态能力的对话应用。用户可以通过安装依赖项和模型推理的步骤来使用该模型。模型还支持微调和微调后推理,通过微调可以改进模型的性能。该模型的推理速度快,资源消耗相对较低。
Qwen-VL-Chat
模型链接:https://modelscope.cn/models/qwen/Qwen-VL-Chat
Qwen-VL
模型链接:https://modelscope.cn/models/qwen/Qwen-VL
0000
评论列表
共(0)条相关推荐
报告称:这些大公司正在使用人工智能来监测员工的在线聊天
划重点:1.🔍"Aware"软件通过扫描Slack和MicrosoftTeams等平台,检测关键词以发现员工不满和安全问题。2.🏢Walmart、Delta、T-Mobile、Chevron、Starbucks等公司据称使用"Aware"监测软件,欧洲公司Nestle和AstraZeneca也参与。站长网2024-02-26 17:31:450000抖音旗下公司申请醒言AI、简涌AI商标
天眼查App显示,近日,抖音集团旗下北京有竹居网络技术有限公司申请注册“醒言AI”“简涌AI”“问问子贡”商标,国际分类为科学仪器、网站服务、教育娱乐,当前商标状态均为等待实质审查。股东信息显示,该公司由抖音集团(香港)有限公司全资持股。站长网2023-10-26 16:43:070002泓博医药将搭建PR-GPT大语言AI模型 提高新药研发效率
泓博医药在2022年度业绩说明会活动记录表中表示,未来公司将自行搭建PR-GPT大语言AI模型,针对性的开展科学语言,尤其是生物医药语言训练,进一步提高公司新药研发效率。泓博医药称,建设PR-GPT的目的在于进一步提高公司的新药研发效率,出于数据安全考虑,PR-GPT未来只对公司研发人员、部分客户及专业人士开放。公司目前跟百度没有合作关系。站长网2023-05-07 09:49:560000入股、整合、价格战,量贩零食进入下半场
2023年,量贩零食成为最炙手可热的明星赛道之一。量贩零食行业发生多起融资,多起融资金额超过千万。一方面,量贩零食行业的行业竞争与整合加剧,赵一鸣零食与零食很忙合并,合并后门店总数突破6500家。行业规模位列量贩零食领域第一与第二的零食很忙集团与万辰集团的“商战”蔓延至社交平台,争夺加盟商,明面开战。站长网2024-02-18 15:52:230002谷歌合并AI研究实验室Google Brain 和 DeepMind
谷歌已将其人工智能研究实验室GoogleBrain和DeepMind合并为一个名为GoogleDeepMind的新部门。新团队将专注于突破性的人工智能产品和进步,同时保持道德标准,使公司能够与OpenAI竞争。站长网2023-04-21 10:25:180000