扳回一局!Gemini-Pro多模态能力和GPT-4V不相上下
要点:
Gemini-Pro在多模态能力上与GPT-4V不相上下,尤其在多模态专有基准MME上表现出1933.4的高分,超过GPT-4V。
在37个视觉理解任务中,Gemini-Pro在文本翻译、颜色/地标/人物识别、OCR等任务中表现突出,而GPT-4V在名人识别任务上得分为0。
在高级认知、挑战性视觉任务和各种专家能力领域,Gemini-Pro展现了强大的视觉感知和理解能力,但在位置识别任务上表现都不佳。
近期的Gemini-Pro评测报告显示其在多模态领域取得了显著的进展,与GPT-4V不相上下,甚至在某些方面表现更为出色。首先,在多模态专有基准MME上的综合表现中,Gemini-Pro以1933.4的高分超越了GPT-4V,展现出在感知和认知方面的全面优势。而在37个视觉理解任务中,Gemini-Pro在文本翻译、颜色/地标/人物识别以及OCR等任务中表现突出,显示了其在基础感知领域的卓越能力。
论文地址:https://arxiv.org/pdf/2312.12436.pdf
项目地址:https://github.com/BradyFU/Awesome-Multimodal-Large-Language-Models
然而,评测也揭示了两者的差异。在名人识别任务上,GPT-4V的得分为0,主要因其拒绝回答相关问题。而在位置识别任务中,两者都呈现出不佳的表现,显示它们对空间位置信息的不敏感。此外,开源模型SPHINX在感知任务上与GPT-4V和Gemini平齐甚至更优,但在认知方面存在较大差距。
评测报告分为基础感知、高级认知、挑战性视觉任务和各种专家能力四大领域,对Gemini-Pro的视觉理解能力进行了详细评估。基础感知测试涵盖了对象级感知、场景级感知和基于知识的感知能力,其中Gemini-Pro在颜色/地标/人物识别和OCR等任务中的表现突出。
高级认知测试则涉及富含文本的视觉推理、抽象视觉推理、解决科学问题、情感分析和智力游戏等任务,显示Gemini-Pro在公式生成和抽象视觉刺激方面取得良好成绩。
挑战性视觉任务包括指称表达式理解、目标跟踪和视觉故事生成等,Gemini-Pro在这些任务中展现了深厚的视觉感知和理解能力。最后,各种专家能力测试涉及缺陷检测和经济分析等任务,Gemini-Pro在股价走势图的分析上显示了出色的专业知识。然而,评测也指出Gemini-Pro在一些任务上存在幻觉问题,需要进一步改进。
Gemini-Pro在多模态领域取得了令人瞩目的成就,展现了其在视觉理解能力上的强大潜力。然而,评测也突显了在特定任务和领域仍需进一步提升的空间。Gemini-Pro的表现表明了多模态技术的潜在威力,为未来的研究和应用提供了有益的启示。
腾讯上线“灾后微助乡村计划”小程序
为支持甘肃临夏州积石山地震灾后重建,12月21日,腾讯公益慈善基金会联合中国乡村发展基金会上线“灾后微助乡村计划”小程序。甘肃、青海受灾区域村委可“码”上申报灾后重建以工代赈需求,让灾后重建更迅速。0000公园“躲猫猫”和City drink爆红:社交游戏的魔力
打开社交媒体平台就不难发现,当代年轻人假期有了新去处。你可以和数十个甚至上百个人相聚公园,通过手机统一共享定位,分为“猫”、“鼠”两队,展开一场现代版“躲猫猫”游戏;也可以相约朋友跨越街区,参加一场“酒鬼马拉松”,去不同酒吧打卡不同风味的精酿,主打一个“Citywalk不如Citydrink”。站长网2023-10-07 17:56:290000三星希望设备端 AI 能提高 Galaxy S24 销量:目标 2024 年出货量达到 3500 万部
随着人工智能(AI)成为科技行业最热门的话题,不少安卓手机制造商正竞相将AI驱动的功能集成到他们的手机中,以吸引更多消费者。最新报道称,三星可能在AI实力上超越Pixel8,该公司据说计划在即将推出的旗舰手机中集成OpenAI的ChatGPT或GoogleBard。三星希望这将帮助其在明年销售3500万部GalaxyS24手机。站长网2023-11-08 09:21:100000设备端人工智能芯片:全球芯片制造商的新战场
随着针对智能手机、笔记本电脑和自动驾驶汽车等智能设备的在设备端的人工智能(On-DeviceAI)技术成为人工智能产业的新兴巨大趋势,全球芯片制造商正在加码竞赛,生产支持内嵌AI的芯片。与生成式AI如ChatGPT相比,On-DeviceAI提供更高安全性、成本更低、功耗更少的定制化和个性化功能。站长网2023-11-06 11:16:490000“尔滨”火了,文旅账号狂飙:“文旅局长”成新晋网红IP?
想你的“疯”,这次“发”到了地方文旅账号。在山东淄博、哈尔滨相继卷出自己的“风味”后,各地文旅局长喜迎“别人家的孩子”,纷纷献出十八般武艺。迄今,地方文旅账号的内容风格主要被两种思路主导,其一是文化古城风。如安徽文旅以意境驱动,视频内容以地方景色辅以古诗词念白,颇为诗情画意。网友评价两极分化,有网友称其为互联网流量热潮中的一股清流,走出了自己的风格,也有网友建议其应与“尔滨”尽快建立互动。站长网2024-01-23 13:54:120001