阿里云发布多模态大模型Qwen-VL-Max版本 性能比肩GPT-4V
站长网2024-01-26 11:32:140阅
阿里云公布了多模态大模型的最新研究成果,继Plus版本之后,再次推出Max版本。
Qwen-VL-Max模型在视觉推理方面展现出卓越的能力,可以理解并分析复杂的图片信息,包括识人、答题、创作和写代码等任务。此外,该模型还具备视觉定位功能,可根据画面指定区域进行问答。
在基础能力方面,Qwen-VL-Max能够准确描述和识别图片信息,并根据图片进行信息推理和扩展创作。这一特性使得该模型在多个权威测评中表现出色,整体性能堪比GPT-4V和Gemini Ultra。
在文档分析(DocVQA)、中文图像相关(MM-Bench-CN)等任务上,Qwen-VL-Max同样超越了GPT-4V,达到了世界最佳水平。
此外,Qwen-VL-Max在图像文本处理方面也取得了显著进步,中英文文本识别能力显著提高。该模型支持百万像素以上的高清分辨率图和极端宽高比的图像,不仅能完整复现密集文本,还能从表格和文档中提取信息。
目前,Qwen-VL-Plus和Qwen-VL-Max限时免费向用户开放。用户可以在通义千问官网、通义千问APP直接体验Max版本模型的能力,也可以通过阿里云灵积平台(DashScope)调用模型API。
0000
评论列表
共(0)条相关推荐
InnAIO:几分钟创建专业的AI视频 提供图像/语音克隆功能
使用InnAIO,您可以在几分钟内创建专业的AI视频,并将文本转换为语音。该软件还支持多种语言和口音,并可以在短短10秒内克隆出5分钟的音频。此外,InnAIO还提供了强大的图像编辑器,使您能够快速创建令人惊叹的视频。该软件还拥有出色的人物增强功能,可美化您的面容。24/7不间断直播,吸引全球受众并减少人力和时间成本。体验地址:https://www.innaio.com/站长网2023-08-31 14:49:160000小米14系列发布 售价3999元起首发第三代骁龙8
近日,小米举办了主题为“跨越时刻”的新品发布会,正式推出了小米14和小米14Pro。这两款新机均搭载了第三代骁龙8移动平台,并搭配全新的小米澎湃OS操作系统。在设计上,小米14提供四种配色选择,包括岩石青、黑色、白色和雪山粉,而小米14Pro除了提供常规配色外,还推出了一款钛金属特别版。站长网2023-10-27 10:34:260001R1登场! Rabbit AI设备售价199美元 或成为未来超级应用
在CES2024展会上,人工智能初创公司Rabbit的首席执行官兼创始人JesseLyu透露,他们推出的新产品R1并非意欲取代智能手机,而是一款售价199美元的独立人工智能设备。尽管R1的雄心勃勃,Lyu表示,取代手机的目标尚未完全实现。站长网2024-01-10 10:06:140000AI“孙燕姿”火了!专家称孙燕姿音色不受法律保护
5月12日消息,一夜之间AI孙燕姿”火遍全网。在B站上,AI孙燕姿翻唱的林俊杰《她说》、周董《爱在西元前》、赵雷《成都》等等,让一众网友深陷无法自拔。网友表示,听了一晚上AI孙燕姿,出不去了......这些翻唱作品基于一个叫做so-vits-svc的开源项目。仅凭数段音频,就可用一个生成式模型来合成目标音色的音频,训练出用户想要的声学模型。这个模型可以保留音高和音调,也可以用不同的语言来翻唱。0000软银寻求与 OpenAI 合作:孙正义计划在 Arm IPO 后大举交易
站长之家(ChinaZ.com)9月18日消息:据FinancialTimes报道,日本综合企业SoftBank(软银集团)的创始人兼首席执行官孙正义有意投资于人工智能(AI)公司,其中包括OpenAI,此前他已成功将芯片技术公司Arm上市。知情人士称,SoftBank可能会与OpenAI形成战略合作伙伴关系,并考虑投资该公司的竞争对手。站长网2023-09-18 09:46:190000