华科大发布多模态大模型新基准 覆盖五大任务
要点:
华中科技大学等机构发布了多模态大模型新基准,对14个主流多模态大模型进行全面评估,覆盖五大任务、27个数据集。
研究团队深入研究了多模态大模型在OCR(光学字符识别)能力上的表现,提出了专门的评测基准OCRBench,揭示了在OCR领域中多模态大模型的局限性。
评估结果显示多模态大模型在一些任务上表现出色,如文本识别、文档问答,但在语义依赖、手写文本和多语言文本等方面存在挑战,需要进一步改进。
近期,华中科技大学等机构发布了一项关于多模态大模型(LMMs)的全面评估新基准,旨在解决多模态大模型性能评估的问题。这项研究涉及了14个主流多模态大模型,包括谷歌Gemini、OpenAI GPT-4V等,覆盖了五大任务、27个数据集。然而,由于多模态大模型的回答具有开放性,评估各个方面的性能成为一个亟待解决的问题。
在这项研究中,特别强调了多模态大模型在光学字符识别(OCR)方面的能力。研究团队深入研究了多模态大模型的OCR性能,并为此构建了一个专门的评测基准,命名为OCRBench。通过对27个公有数据集和2个生成的无语义和对比的有语义的数据集上进行广泛实验,揭示了多模态大模型在OCR领域的局限性。论文详细介绍了评测模型的概述、指标以及使用的评测数据集。
项目地址:https://github.com/Yuliang-Liu/MultimodalOCR
评估结果显示,多模态大模型在一些任务上表现出色,如文本识别、文档问答等。然而,在语义依赖、手写文本和多语言文本等方面,这些模型存在一定的挑战。特别是在处理缺乏语义的字符组合时,性能较差。手写文本和多语言文本的识别也呈现出较大的挑战,可能与训练数据的不足有关。此外,高分辨率输入图像对于一些任务,如场景文本问答、文档问答和关键信息抽取,具有更好的表现。
为了解决这些限制,研究团队构建了OCRBench,以便更准确地评估多模态大模型的OCR能力。这一举措有望为多模态大模型的未来发展提供指导,并促使更多的改进和研究,以进一步提升其性能和应用领域的拓展。
在这个多模态大模型评估的新时代,OCRBench的引入为研究者和开发者提供了一个更为准确和全面的工具,以评估和改进多模态大模型的OCR能力,推动该领域的发展。这项研究不仅为多模态大模型的性能评估提供了新的思路,也为相关领域的研究和应用奠定了更加扎实的基础。
AI+视频娱乐平台大盘点,谁会成为下一个“Netflix”
故事,是对现实的剖析和重构。讲好一个故事,需要创造性地把素材组织起来。在AI时代,一个好的故事又将如何被呈现出来呢?今年,是视频生成类产品爆发式增长的一年。在AI生成的视频中,我们看到创作者在用一种新的方式讲述着自己的故事。同样,AI视频内容是通过新的创作方式诞生的新娱乐内容形态,有可能诞生2C平台级的机会。站长网2024-07-30 14:35:260000OPPO:基于AndesGPT大模型的新小布1.0公测开启
今天,OPPO宣布启动基于AndesGPT大模型的全新小布助手的第一轮公开测试。新的AndesGPT大模型通过4位量化技术,可以在不影响精度的前提下,实现在端侧的逐步部署和性能优化。AndesGPT大模型是由OPPO旗下的安第斯智能云团队打造,是一种基于混合云架构的生成式大语言模型。它融合了中文对话数据的持续学习、指令精调、人类反馈强化学习和知识增强等关键技术。站长网2023-10-11 17:16:390000微信从严治理传授恶意投诉非法牟利违规内容
微信发布《关于从严治理传授恶意投诉非法牟利违规内容的公告》称,随着维权和投诉渠道更加多样便捷,以恶意投诉举报牟取不当利益的违法违规行为也层出不穷,甚至在互联网平台出现了以产品质量、食品安全、垃圾短信等作为目标,教唆开展恶意投诉牟取不当利益的“教程”。此类行为涉嫌触碰法律红线,不仅扰乱了正常的市场秩序,而且挤占群众正常维权渠道,使用户的合理诉求无法得到及时处理,引发社会各界高度关注。站长网2023-06-06 16:24:440002两年20亿,远方好物靠谱吗?
各位村民好,我是村长好久好久没有聊社交电商了。最近有不少朋友向我推荐远方好物这个平台,顺便问我怎么看?其实我最早知道这个平台的,还有像杭州的蜂享家也比较熟悉。那么这个项目是否靠谱、能不能做、以及社交电商还有没有机会,今天和大家交流一下。01社交电商的模式本质上没有变化不管是远方好物还是其他的社交电商平台,本质上就是招募代理分销卖货。0000甲骨文在其人力资源软件中添加生成式 AI 功能 帮助撰写工作描述和绩效目标
甲骨文公司周三表示,该公司正在将生成式人工智能功能添加到其面向企业的人力资源软件中,旨在帮助撰写工作描述和员工绩效目标等任务。像ChatGPT这样的能够对提示生成类似人类回答的AI系统已经在技术行业引起轰动,包括微软公司和Alphabet旗下的谷歌在内的公司已将其整合到搜索引擎中。站长网2023-06-29 15:45:580002