阿里巴巴多模态模型Qwen-VL升级更新 推出这2个版本
站长网2024-01-31 11:41:331阅
阿里巴巴的多模态模型Qwen-VL经过升级更新,推出了Qwen-VL-Plus和Qwen-VL-Max版本。这两个版本在多个文本-图像多模态任务上与Gemini Ultra和GPT-4V相当。

试用地址:https://huggingface.co/spaces/Qwen/Qwen-VL-Max
Qwen-VL-Max在中文问答和中文文本理解任务上超越了GPT-4V和Gemini,同时在图像相关推理能力和识别、提取和分析图像细节上都有显著提升。这两个版本还支持处理高达一百万像素的高清图像以及各种宽高比的图像。
Qwen-VL-Plus针对细节识别和文本识别能力进行了显著升级,支持超高像素分辨率和任意宽高比的图像输入,在广泛的视觉任务上提供了显著的性能提升。
而Qwen-VL-Max则在视觉推理和指令跟随能力方面有所改进,提供了更高级别的视觉感知和认知理解,在更广泛的复杂任务上提供了最优性能。这两个版本甚至能识别Gif图,展现出了强大的识别能力。
0001
评论列表
共(0)条相关推荐
实时AI互动平台Albus Beta 巧妙融合GPT技术和多元化功能
AlbusBeta,作为一款实时的AI互动平台,通过引入GPT技术,旨在以全新的方式从多个视角深度挖掘用户所热衷的各类主题,使探索之旅更为有趣且富有成效。该平台的核心功能在于利用GPT技术,为用户提供一个实时的探索平台,使用户能够以崭新的视角来深入研究自己感兴趣的主题。除了助力用户发现新思想、概念和观点外,AlbusBeta还能够协助用户更深入地理解和掌握他们关心的领域。站长网2023-11-30 16:42:270000雷军:小米13Ultra主摄采用IMX989 副摄采用三颗IMX858
就在刚刚,雷军继续分享了小米13Ultra的硬件选型过程。雷军表示,小米13Ultra主摄选了IMX989,目前移动影像最强的,索尼和小米联合研发的。确定IMX989后,副摄其实也确定了:IMX858,目前索尼移动传感器中技术最领先的。雷军表示:1.IMX858是索尼传感器唯一支持MCSS(多摄同步系统),可以实现更好的多摄一致性;站长网2023-04-13 15:18:030002阿里云Serverless应用引擎SAE2.0上线 函数计算集成大模型框架
阿里云宣布Serverless应用引擎SAE2.0正式公测上线。全面升级后的SAE2.0具备极简体验、标准开放、极致弹性三大优势,应用冷启动全面提效,秒级完成创建发布应用,应用成本下降40%以上。站长网2023-08-08 09:05:230000Kore.ai获得1.5亿美元用于开发对话式AI平台 英伟达也参投
Kore.ai获得了1.5亿美元的投资,用于开发其对话/生成型人工智能平台技术。这轮融资于周二(1月30日)宣布,由FTVCapital领投,芯片制造商英伟达也参与了投资。这家总部位于佛罗里达州奥兰多的公司表示,它将利用这笔资金扩大其生成型人工智能(AI)平台的使用。新闻稿中写道:“帮助各种规模的公司安全、负责地利用AI推动业务互动,同时实现显著的收入和成本节省。”站长网2024-01-31 15:52:510000Faraday Future:某些群体通过传播不实信息破坏公司估值
FaradayFuture今日发文称,最近观察到一系列可疑活动,某些群体正通过传播不实信息、操纵市场情绪来合力破坏公司估值。为了解决上述问题,FaradayFuture将继续通过公开披露提供准确及时的信息,以确保各方平等获得关于公司业绩和前景的事实。站长网2023-09-08 15:22:510000