Meta发布类GPT-4o多模态模型Chameleon
Meta最近发布了一个名为Chameleon的多模态模型,它在多模态模型发展中设立了新的标杆。Chameleon是一个早期融合的基于token的混合模态模型家族,能够理解并生成任意顺序的图像和文本。它通过一个统一的Transformer架构,使用文本、图像和代码混合模态完成训练,并且对图像进行分词化,生成交错的文本和图像序列。
Chameleon模型的创新之处在于其早期融合方法,所有处理流程从一开始就映射到一个共同的表示空间,让模型能够无缝处理文本和图像。它在各种任务上展示了广泛的能力,包括视觉问答、图像标注、文本生成、图像生成和长形式混合模态生成。在图像标注任务上,Chameleon达到了最先进的性能,并且在文本任务上超越了Llama-2,与Mixtral8x7B和Gemini-Pro等模型竞争。
论文地址:https://arxiv.org/pdf/2405.09818
Chameleon模型在技术上面临了重大挑战,Meta的研究团队引入了一系列架构创新和训练技术。例如,他们开发了新的图像分词器,基于8192大小的codebook,将512×512的图像编码为1024个离散的token。此外,Chameleon使用了sentencepiece开源库训练的BPE分词器。
在预训练阶段,Chameleon使用了混合模态数据,包括纯文本、文本-图像对以及文本和图像交错的多模态文档。预训练分为两个阶段,第一阶段无监督学习,第二阶段混合更高质量的数据。
Chameleon模型在基准评估中全面超越了Llama2,在常识推理、阅读理解、数学问题和世界知识领域都取得了显著的效果。在人工评估和安全测试中,Chameleon-34B的表现也远远超过了Gemini Pro和GPT-4V。
尽管Chameleon缺少GPT-4o中的语音能力,但Meta的产品管理总监表示,他们非常自豪能够支持这个团队,并希望让GPT-4o更接近开源社区。这可能意味着不久的将来,我们可能会得到一个开源版的GPT-4o。
Chameleon模型的发布,展示了Meta在多模态模型领域的重大进展,它不仅推动了多模态模型的发展,也为未来的研究和应用提供了新的可能性。
OpenAI和微软被The Intercept等三家新闻机构起诉,指控侵犯版权
**划重点:**1.🚫《TheIntercept》,《RawStory》和《AlterNet》指控OpenAI和Microsoft故意从培训数据中删除作者、标题等重要版权信息。2.📝原告声称ChatGPT在一些情况下“抄袭或几乎抄袭”受版权保护的新闻作品,却未提供其中的作者、标题、版权或使用条款信息。站长网2024-02-29 09:39:420000开源版「ChatGPT Plus」来了,能做数据分析、插件调用、自动上网,落地真实世界的智能体
OpenAIChatGPTPlus订阅付费功能强大,可以实现高阶「数据分析」(AdvancedDataAnalysis)、「插件调用」(Plugins)以及「自动网页浏览」(BrowsewithBing),能够作为日常生活中的重要生产力工具。可是因为商业原因而选择了闭源,研究者和开发者也只能使用而没有办法在其上面做任何的研究或改进。站长网2023-10-25 19:48:330000标准版性能表现超越行业Pro!OPPO Find X7系列搭载潮汐架构
站长之家(ChinaZ.com)1月3日消息:OPPO今日宣布,OPPOFindX7系列将于1月8日14:30正式发布。OPPOFindX7系列最大的亮点在于其搭载的自研潮汐架构。这一创新架构旨在解决移动平台面临的存算分离和芯片调度问题,提升芯片性能和能效。据OPPO介绍,潮汐架构可以使CPU、GPU访问效率平均提升26.7%,整机续航提升20%,游戏实测帧率达到60.8FPS。站长网2024-01-03 11:07:130000下周上市!小度CEO确认:小度青禾学习手机性能大致在2000元档
快科技5月17日消息,百度小度今天正式官宣了旗下首款手机小度青禾学习手机。不过官方未公布任何参数信息,只是介绍了学习有关的功能,预告将会在5月22日开启预售。在今日举办的小度青禾手机沟通会上,小度CEO景鲲提前透露了一些信息,称小度青禾手机的参数配置大致是8核CPU、5000万像素摄像头,具体的性能大致处于市面上2000元左右手机的档位。站长网2023-05-18 07:11:030000