扳回一局!Gemini-Pro多模态能力和GPT-4V不相上下
要点:
Gemini-Pro在多模态能力上与GPT-4V不相上下,尤其在多模态专有基准MME上表现出1933.4的高分,超过GPT-4V。
在37个视觉理解任务中,Gemini-Pro在文本翻译、颜色/地标/人物识别、OCR等任务中表现突出,而GPT-4V在名人识别任务上得分为0。
在高级认知、挑战性视觉任务和各种专家能力领域,Gemini-Pro展现了强大的视觉感知和理解能力,但在位置识别任务上表现都不佳。
近期的Gemini-Pro评测报告显示其在多模态领域取得了显著的进展,与GPT-4V不相上下,甚至在某些方面表现更为出色。首先,在多模态专有基准MME上的综合表现中,Gemini-Pro以1933.4的高分超越了GPT-4V,展现出在感知和认知方面的全面优势。而在37个视觉理解任务中,Gemini-Pro在文本翻译、颜色/地标/人物识别以及OCR等任务中表现突出,显示了其在基础感知领域的卓越能力。

论文地址:https://arxiv.org/pdf/2312.12436.pdf
项目地址:https://github.com/BradyFU/Awesome-Multimodal-Large-Language-Models
然而,评测也揭示了两者的差异。在名人识别任务上,GPT-4V的得分为0,主要因其拒绝回答相关问题。而在位置识别任务中,两者都呈现出不佳的表现,显示它们对空间位置信息的不敏感。此外,开源模型SPHINX在感知任务上与GPT-4V和Gemini平齐甚至更优,但在认知方面存在较大差距。
评测报告分为基础感知、高级认知、挑战性视觉任务和各种专家能力四大领域,对Gemini-Pro的视觉理解能力进行了详细评估。基础感知测试涵盖了对象级感知、场景级感知和基于知识的感知能力,其中Gemini-Pro在颜色/地标/人物识别和OCR等任务中的表现突出。
高级认知测试则涉及富含文本的视觉推理、抽象视觉推理、解决科学问题、情感分析和智力游戏等任务,显示Gemini-Pro在公式生成和抽象视觉刺激方面取得良好成绩。
挑战性视觉任务包括指称表达式理解、目标跟踪和视觉故事生成等,Gemini-Pro在这些任务中展现了深厚的视觉感知和理解能力。最后,各种专家能力测试涉及缺陷检测和经济分析等任务,Gemini-Pro在股价走势图的分析上显示了出色的专业知识。然而,评测也指出Gemini-Pro在一些任务上存在幻觉问题,需要进一步改进。
Gemini-Pro在多模态领域取得了令人瞩目的成就,展现了其在视觉理解能力上的强大潜力。然而,评测也突显了在特定任务和领域仍需进一步提升的空间。Gemini-Pro的表现表明了多模态技术的潜在威力,为未来的研究和应用提供了有益的启示。
抖音、瑞幸宣布启动鸿蒙相关岗位招聘
站长之家(ChinaZ.com)11月27日消息:近日,抖音与瑞幸咖啡宣布已经启动鸿蒙相关职位的招聘,为推动技术创新和发展迎来新一波高端人才。站长网2023-11-27 10:48:320002斯坦福女神辍学再创业,获OpenAI力挺,全球首个0代码AI工程师出世
世界首个不用编码AI工程师Heyboss横空出世!一句话创建超级应用,99%人也能当程序员。世界首个「0代码」AI工程师Heyboss诞生了!最近,初创HeybossAI官宣了AI非编码工具Heyboss,专为代码小白量身打造。也就意味着,未来并不是只有写代码,才能成为开发者。动动嘴皮子,任何人可以开发出一个超级应用的时代诞生了。站长网2025-02-07 15:59:180000研究发现:人工智能评估简历存在性别歧视 尤其对职场父母不利
性别偏见在招聘和工作中根深蒂固。而最新研究发现,人工智能在职场中对父母身份的工作者存在偏见。墨尔本大学的一份研究发现,尽管采取了简历盲目筛选等措施,人工智能仍然会通过性别信号来判断求职者的适合性。研究人员向ChatGPT展示了简历,并要求其按照从0到100的范围来评估此人是否适合某项工作。研究中对六种不同的职业重复此操作,每份简历重复30次,以确保结果可靠。站长网2023-07-25 17:18:240000深度解析类UP主,走不出商业围城?
深度解读内容,正在成为B站内容的重要构成。克劳锐《2024看得见的粉丝价值—五大平台KOL粉丝分析研究报告》显示,2023年B站增粉速度最快的KOL中,@小约翰可汗、@木鱼水心表现突出。这类历史和影视区博主,他们已然成为B站创作者的重要组成。站长网2024-06-26 22:45:340000第一代iPad Pro无缘了!iPadOS 17正式版本月发
快科技9月5日消息,业内人士MarkGurman透露,苹果将在本月新品发布会上推出iOS17和iPadOS17正式版系统。相比上一代iPadOS16,iPadOS17系统发布时间提前了一个月左右。众所周知,iOS16正式版是2022年9月份发布的,iPadOS16因台前调度未优化好,苹果将其推迟至2022年10月24日上线。站长网2023-09-05 09:55:460000