阿里云发布多模态大模型Qwen-VL-Max版本 性能比肩GPT-4V
站长网2024-01-26 11:32:140阅
阿里云公布了多模态大模型的最新研究成果,继Plus版本之后,再次推出Max版本。
Qwen-VL-Max模型在视觉推理方面展现出卓越的能力,可以理解并分析复杂的图片信息,包括识人、答题、创作和写代码等任务。此外,该模型还具备视觉定位功能,可根据画面指定区域进行问答。
在基础能力方面,Qwen-VL-Max能够准确描述和识别图片信息,并根据图片进行信息推理和扩展创作。这一特性使得该模型在多个权威测评中表现出色,整体性能堪比GPT-4V和Gemini Ultra。
在文档分析(DocVQA)、中文图像相关(MM-Bench-CN)等任务上,Qwen-VL-Max同样超越了GPT-4V,达到了世界最佳水平。
此外,Qwen-VL-Max在图像文本处理方面也取得了显著进步,中英文文本识别能力显著提高。该模型支持百万像素以上的高清分辨率图和极端宽高比的图像,不仅能完整复现密集文本,还能从表格和文档中提取信息。
目前,Qwen-VL-Plus和Qwen-VL-Max限时免费向用户开放。用户可以在通义千问官网、通义千问APP直接体验Max版本模型的能力,也可以通过阿里云灵积平台(DashScope)调用模型API。
0000
评论列表
共(0)条相关推荐
中国用户量最多互联网企业出炉:腾讯用户超12亿居首
快科技1月30日消息,今天数据研究公司QuestMobile发布了2023中国移动互联网年度报告,总用户量超5亿的互联网企业达12家,其中腾讯以12.21亿的用户量位居首位。数据显示,截止2023年12月,腾讯控股、阿里巴巴、百度集团及抖音集团企业流量均超10亿,5亿规模以上企业达12家。站长网2024-01-30 18:04:41000011/13英寸可选 苹果全新iPad Air 6今日开售:4799元起
快科技5月15日消息,据苹果官方消息,全新一代主打{tag_keyurl_6}的iPadAir6今天正式发售,价格是4799元起。值得注意的是,这代产品是Air系列首次推出双尺寸,分别提供了11英寸、13英寸可选。更大的尺寸可以在办公、学习时提供更方便的操作,影音娱乐也更加沉浸。站长网2024-05-15 08:04:150000新加坡樟宜机场测试人工智能安检以缩短时间
##划重点:-🤖新加坡樟宜机场正在测试一套人工智能驱动的系统,可以潜在地减少乘客安检时间。-🧳在3号航站楼进行的试验使用人工智能和机器学习来筛选和解释X射线机器检查登机口行李的图像,从而减少处理这些图像所需的时间和人为错误的机会。-📈初步结果显示,新系统在标记一些禁止物品方面表现得和或优于人类安检员,这一发展仍处于早期阶段,最终目标是提高自动化水平。站长网2023-11-27 15:30:140001QQ音乐2024版本发布 新增我的唱片架、城市律动播放器等功能
QQ音乐发布了2024全新版本,这是QQ音乐18周年焕新特别版。新版本的界面、图标等视觉元素简约不失高级的设计,符合年轻人的极简美学追求。在功能特性上,新版本推出了一系列个性化的互动功能,如“我的唱片架”、“城市律动播放器”、“2024纪念版播放器”和“音色魔法师”,满足年轻音乐爱好者的多样化需求。站长网2023-12-22 16:00:370000AI日报:会颠勺的国产机器人Astribot S1来了;Synthesia推能读懂文字情绪的数字人;OpenVoice V2版本发布;DeepFacelive让你在直播中实时换脸
欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。新鲜AI产品点击了解:https://top.aibase.com/1、Synthesia推出新型数字人Expressive-1正式版能看懂你文字里的情绪站长网2024-04-27 17:42:570001