中国团队开源大规模高质量图文数据集ShareGPT4V
要点:
中国团队开源大规模高质量图文数据集ShareGPT4V,基于GPT4-Vision构建,训练了一个7B模型,在多模态性能上超越同级模型。
ShareGPT4V数据集包含120万条图像-文本描述数据,涵盖世界知识、对象属性、空间关系、艺术评价等多方面,超越现有数据集在多样性和信息涵盖度方面。
使用ShareGPT4V数据集进行实验,研究者展示了其在多种架构和参数规模的多模态模型中的有效性,最终得到了在多模态基准测试上表现优异的ShareGPT4V-7B模型。
中国团队最近开源了一个引人瞩目的图文数据集,命名为ShareGPT4V,它基于GPT4-Vision构建,训练了一个7B模型。这一举措在多模态领域取得了显著的进展,超越了同级别的模型。
该数据集包含了120万条图像-文本描述数据,涵盖了世界知识、对象属性、空间关系、艺术评价等多个方面,在多样性和信息涵盖度上明显优于现有数据集。
论文地址:https://arxiv.org/abs/2311.12793
Demo演示:https://huggingface.co/spaces/Lin-Chen/ShareGPT4V-7B
项目地址:https://github.com/InternLM/InternLM-XComposer/tree/main/projects/ShareGPT4V
多模态模型的性能在很大程度上受制于模态对齐的效果,而现有工作中缺乏大规模高质量的图像-文本数据。为了解决这一问题,中科大和上海AI Lab的研究者们推出了ShareGPT4V,这是一个开创性的大型图文数据集。
通过对GPT4-Vision模型产生的10万条图像-文本描述数据进行深入研究,他们成功构建了这一高质量的数据集,涉及的内容丰富多样,包括世界知识、艺术评价等。
这一数据集的推出为多模态研究和应用奠定了新的基石。在实验中,研究者们展示了ShareGPT4V数据集在多种架构和参数规模的多模态模型中的有效性。通过等量替换实验,他们成功提升了多种模型的性能。
最终,通过在预训练和有监督微调阶段同时使用ShareGPT4V数据集,他们得到了ShareGPT4V-7B模型,在多模态基准测试中取得了优异的成绩。
这一研究为未来的多模态研究和应用提供了有力支持,也促使多模态开源社区关注高质量图像描述的开发,预示着更强大、智能的多模态模型的出现。这一成果对于推动人工智能领域的发展具有积极的意义。
iPhone 15登上京东百亿补贴:256G到手6458元 性价比暴增
快科技9月28日消息,iPhone15登上京东百亿补贴,256GB黑色到手价是6458元,相比官方首发价格要香”一点。这次iPhone15标准版也采用了灵动岛”设计,不过其屏幕刷新率是60Hz。但是相比上一代的刘海屏方案,有了灵动岛之后,iPhone15看App弹窗信息更加直观方便。站长网2023-09-29 10:29:410000国产黑马与GPT-4o称霸中文榜首!Yi-Large勇夺国内LLM盲测桂冠,冲进世界第七
【新智元导读】真正与GPT-4o齐头并进的国产大模型来了!刚刚,LMSYS揭开最新榜单,黑马Yi-Large在中文分榜上与GPT-4o并列第一,而在总榜上位列世界第七,紧追国际第一阵营,并登上了国内大模型盲测榜首。站长网2024-05-22 01:00:540001AI日报:Claude 3 Haiku支持微调;Heygen推对口型工具;百度称萝卜快跑安全水平接近C919飞机
欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。新鲜AI产品点击了解:https://top.aibase.com/1、Anthropic宣布Claude3Haiku支持微调站长网2024-07-12 16:50:310000Sam Altman放豪言:OpenAI训GPT-5不差钱,人类已接近AGI阈值
【新智元导读】前段时间,OpenAICEOSamAltman和CTOMiraMurati在WSJ的专访里,探讨了AGI、未来GPT的发展、以及AI对人类的影响。「OpenAI的最终目标为什么是AGI?什么是AGI?」「ChatGPT以及其他语言模型的用途是什么?」「人类与人工智能的关系在未来会发生什么变化?」0000谷歌打击SEO垃圾邮件和利用 AI 操纵搜索排名的做法
谷歌今天宣布了一项重大搜索质量更新,旨在提高搜索结果质量并惩罚那些滥用人工智能和其他垃圾技术操纵搜索排名的网站。此举针对的是那些"为搜索引擎而不是为人们"创建内容的网站,尤其是那些利用自动化技术大规模生产低质量内容的网站。站长网2024-03-06 10:22:210000