阿里巴巴多模态模型Qwen-VL升级更新推出这2个版本

站长网2024-01-31 11:41:331阅

阿里巴巴的多模态模型Qwen-VL经过升级更新，推出了Qwen-VL-Plus和Qwen-VL-Max版本。这两个版本在多个文本-图像多模态任务上与Gemini Ultra和GPT-4V相当。

试用地址:https://huggingface.co/spaces/Qwen/Qwen-VL-Max

Qwen-VL-Max在中文问答和中文文本理解任务上超越了GPT-4V和Gemini，同时在图像相关推理能力和识别、提取和分析图像细节上都有显著提升。这两个版本还支持处理高达一百万像素的高清图像以及各种宽高比的图像。

Qwen-VL-Plus针对细节识别和文本识别能力进行了显著升级，支持超高像素分辨率和任意宽高比的图像输入，在广泛的视觉任务上提供了显著的性能提升。

而Qwen-VL-Max则在视觉推理和指令跟随能力方面有所改进，提供了更高级别的视觉感知和认知理解，在更广泛的复杂任务上提供了最优性能。这两个版本甚至能识别Gif图，展现出了强大的识别能力。

阿里巴巴多模态模型QwenVL升级更新推出这2个版本

0001

评论列表

共(0)条

相关推荐

站长资讯
腾讯文库正式发布：汇集亿级专业文档一键转文档编辑
快科技8月30日消息，腾讯今晚突然正式发布了一款重磅新品腾讯文库。腾讯号称为专业权威的内容消费与发布平台”，汇集海量优质内容，覆盖众多专业领域，无论是考试真题、法律合同还是求职简历都能快速找到。同时还搭载AI智能助手助力，支持一键总结、生成思维导图，快速掌握内容大纲。针对内容创作方面，腾讯文库还支持AI辅写。腾讯文库还可以无缝融合腾讯文档，随时随地点击即用。
站长网2024-08-31 16:53:30
0000
站长资讯
时空穿越而已,有什么难的?(没骗你)
物理定律允许先进文明的成员以他们希望的速度穿越到未来。而回到过去又是另一回事；我们不知道这是否仍遵循物理学定律，这个答案很可能是受一套我们还不太了解的物理定律所控制：量子引力定律。为了让人类能迅速穿越到未来，或者回到过去（如果允许的话），我们需要的技术远远超过我们今天的能力。
站长网2023-05-24 14:54:22
0000
站长资讯
大模型六小虎，要撞上版权墙了
“几乎没有一家大模型公司的AI视频生成训练，会找视频网站授权。”2025年伊始，在视频生成领域立志“追平Sora”的大模型公司，撞上了版权墙。AI创业者陈临告诉字母榜（ID:wujicaijing），这其中也包括被称为“AI六小虎”的6家中国大模型独角兽。而缺乏授权的模型训练，势必将成为大模型公司们的潜在风险。如今，在热度不减的AI视频生成赛道，“视频平台诉大模型侵权”第一案已经出现。
站长网2025-01-10 18:02:49
0000
站长资讯
谷歌 Pixel 8 的换脸照片工具引发人工智能操纵争论
站长之家(ChinaZ.com)10月23日消息:现如今利用手机上的数字工具对照片进行实时编辑已经成为了一种普遍现象，从增强颜色到调整光线水平等。如今，一种新型的基于人工智能（AI）的智能手机工具让我们重新思考什么是「拍摄现实」。上周发布的谷歌最新智能手机Pixel8和Pixel8Pro，比其他公司的设备走得更远，它们使用AI帮助改变照片中人物的表情。
站长网2023-10-24 21:25:10
0000
45岁洁柔的霸总私域路线
“你们有看到今天私域运营中一些新的玩法，新的趋势吗?”“其实我们就在试图探索一条不止于GMV的路，试图去赶上新的趋势。”谈到私域运营的未来，中顺洁柔集团副总裁兼首席内容官吕白如是说道。今天的洁柔，已经是一个有着45年历史的大企业，在微信支付有优惠渠道快消品行业做到了第一。一个老牌的企业，却在持续年轻化，各大平台上盛传着洁柔“霸总”的传说。
站长网站长资讯2023-10-26 09:03:08
0002