中国团队开源大规模高质量图文数据集ShareGPT4V
要点:
中国团队开源大规模高质量图文数据集ShareGPT4V,基于GPT4-Vision构建,训练了一个7B模型,在多模态性能上超越同级模型。
ShareGPT4V数据集包含120万条图像-文本描述数据,涵盖世界知识、对象属性、空间关系、艺术评价等多方面,超越现有数据集在多样性和信息涵盖度方面。
使用ShareGPT4V数据集进行实验,研究者展示了其在多种架构和参数规模的多模态模型中的有效性,最终得到了在多模态基准测试上表现优异的ShareGPT4V-7B模型。
中国团队最近开源了一个引人瞩目的图文数据集,命名为ShareGPT4V,它基于GPT4-Vision构建,训练了一个7B模型。这一举措在多模态领域取得了显著的进展,超越了同级别的模型。
该数据集包含了120万条图像-文本描述数据,涵盖了世界知识、对象属性、空间关系、艺术评价等多个方面,在多样性和信息涵盖度上明显优于现有数据集。

论文地址:https://arxiv.org/abs/2311.12793
Demo演示:https://huggingface.co/spaces/Lin-Chen/ShareGPT4V-7B
项目地址:https://github.com/InternLM/InternLM-XComposer/tree/main/projects/ShareGPT4V
多模态模型的性能在很大程度上受制于模态对齐的效果,而现有工作中缺乏大规模高质量的图像-文本数据。为了解决这一问题,中科大和上海AI Lab的研究者们推出了ShareGPT4V,这是一个开创性的大型图文数据集。
通过对GPT4-Vision模型产生的10万条图像-文本描述数据进行深入研究,他们成功构建了这一高质量的数据集,涉及的内容丰富多样,包括世界知识、艺术评价等。
这一数据集的推出为多模态研究和应用奠定了新的基石。在实验中,研究者们展示了ShareGPT4V数据集在多种架构和参数规模的多模态模型中的有效性。通过等量替换实验,他们成功提升了多种模型的性能。
最终,通过在预训练和有监督微调阶段同时使用ShareGPT4V数据集,他们得到了ShareGPT4V-7B模型,在多模态基准测试中取得了优异的成绩。
这一研究为未来的多模态研究和应用提供了有力支持,也促使多模态开源社区关注高质量图像描述的开发,预示着更强大、智能的多模态模型的出现。这一成果对于推动人工智能领域的发展具有积极的意义。
马斯克称微软使用推特数据非法训练其人工智能 威胁要提起诉讼
微软将在下周将Twitter从其广告平台中删除,这是在Twitter宣布它将开始向其API的用户(包括企业和研究机构)每月收取至少42000美元的费用近两个月后。凭借其2.15万亿美元的市值和去年年底手头约1000亿美元的现金,微软显然有足够的钱向Twitter支付它想要的东西,所以此举似乎有点像一个声明,即使微软拒绝进一步阐述其决定。站长网2023-04-20 09:15:070001谷歌推出新图像控制方式 可在StableDiffusion图像生成中保证内容特征一致性
Google最近推出了一种新的图像生成技术,通过保证内容特征的一致性,可以生成具有相同视觉特征的连贯图像。这对于故事可视化、游戏开发和广告等领域非常重要,因为在生成过程中,角色或内容的一致性是必需的。论文地址:https://arxiv.org/pdf/2311.10093.pdf站长网2023-11-20 11:22:440005OpenAI CEO 访韩 或就 AI 芯片合作事宜与 SK 集团会长会面
随着企业和消费者对人工智能(AI)应用的兴趣日益浓厚,对AI芯片的需求也在快速增长。为应对可能的芯片短缺,美国AI初创公司OpenAI正在寻求解决方案。据报道,OpenAI计划成立一家芯片制造公司。OpenAICEO萨姆・阿尔特曼本周访问韩国首尔,据推测他将与SK集团会长崔泰源就AI芯片合作进行商谈。阿尔特曼此行还可能与三星电子就代工和存储器方面的合作进行洽谈。站长网2024-01-22 09:27:450000报道称,Meta 计划于7月推出新的AI语言模型 Llama3
划重点:-💡Meta计划于7月推出最新版本的人工智能大型语言模型Llama3,能够更好地回答用户提出的有争议性问题。-💡Llama3将具有更强大的推理能力和更准确的预测能力,可应对复杂问题。-💡这一举措显示Meta在AI领域的持续投资和发展,将进一步推动人工智能技术的应用和发展。站长网2024-02-29 10:09:480000四战搜索,抖音难造“百度”
执念太深!抖音还是没放弃搜索,并发起一场持久战。据Tech星球报道,继头条搜索、悟空搜索、闪电搜索之后,抖音于近期推出第4个独立搜索APP——“抖音搜索”,标志着其第四次向搜索领域发起挑战。搜索——这个古早的互联网内容产品,撑起巨头百度。当内容江湖生变,搜索的新战场转向视频领域。抖音几次试图抓住这弯道超车的大好机会,抢占搜索这块蛋糕。站长网2024-09-02 09:51:390000