阿里巴巴多模态模型Qwen-VL升级更新 推出这2个版本
站长网2024-01-31 11:41:331阅
阿里巴巴的多模态模型Qwen-VL经过升级更新,推出了Qwen-VL-Plus和Qwen-VL-Max版本。这两个版本在多个文本-图像多模态任务上与Gemini Ultra和GPT-4V相当。
试用地址:https://huggingface.co/spaces/Qwen/Qwen-VL-Max
Qwen-VL-Max在中文问答和中文文本理解任务上超越了GPT-4V和Gemini,同时在图像相关推理能力和识别、提取和分析图像细节上都有显著提升。这两个版本还支持处理高达一百万像素的高清图像以及各种宽高比的图像。
Qwen-VL-Plus针对细节识别和文本识别能力进行了显著升级,支持超高像素分辨率和任意宽高比的图像输入,在广泛的视觉任务上提供了显著的性能提升。
而Qwen-VL-Max则在视觉推理和指令跟随能力方面有所改进,提供了更高级别的视觉感知和认知理解,在更广泛的复杂任务上提供了最优性能。这两个版本甚至能识别Gif图,展现出了强大的识别能力。
0001
评论列表
共(0)条相关推荐
百度发布2023年第四季度财报 李彦宏:继续坚定对生成式AI投入
百度公布了其2023年第四季度及全年的财务报告,全年总营收高达1345.98亿元,同比增速达39%,归属百度的净利润(non-GAAP)为287亿元,同样实现了显著增长。在第四季度,百度的营收达到了349.51亿元,同比增长44%,净利润(non-GAAP)为77.55亿元。值得一提的是,百度全年营收和利润均超过了市场预期。站长网2024-02-28 17:53:300000AI日报:阿里推多角色一致性框架UniPortrait;腾讯混元上线三款ControlNet插件;苹果研发桌面机器人;Claude推提示词缓存功能
欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。新鲜AI产品点击了解:https://top.aibase.com/1、阿里团队推新框架UniPortrait:支持多角色一致性和风格参考站长网2024-08-16 08:30:460000高斯绘画工具开源 可用于艺术创作和机器学习研究
高斯绘画器是一个使用三维高斯斑点绘制图像的框架。它基于高斯斑点渲染技术,可以以非常逼真的方式渲染和重建图像。该项目提供了一个使用Python编写的开源实现,可以用于艺术创作和机器学习研究。项目地址:https://github.com/ReshotAI/gaussian-painters站长网2023-09-05 10:38:080000开发者狂喜!Meta最新发布的LLM Compiler,实现77%自动调优效率
Meta搞了个很牛的LLMCompiler,帮助程序员更高效地写代码。昨天,三大AI巨头OpenAI、Google、Meta组团发布自家大模型最新研究成果——OpenAI推出基于GPT-4训练的专门找bug的新模型CriticGPT,谷歌开源9B、27B版Gemma2,而Meta则拿出了一项最新的人工智能突破——LLMCompiler。站长网2024-06-30 19:32:400000两大绝招!华为将SSD寿命提升一个量级:延长30-50%
快科技6月29日消息,如今的SSD容量越做越大,企业级SSD容量已达30TB、60TB的、甚至120TB。但SSD寿命一直是致命伤”,越大容量的盘,出现故障后,丢失的数据就越多。近日,华为数据存储发文,揭开华为全闪分布式存储让SSD大盘更长寿”的秘诀。首先,为什么SSD会有寿命问题?站长网2024-06-29 22:35:500000