Meta发布类GPT-4o多模态模型Chameleon
Meta最近发布了一个名为Chameleon的多模态模型,它在多模态模型发展中设立了新的标杆。Chameleon是一个早期融合的基于token的混合模态模型家族,能够理解并生成任意顺序的图像和文本。它通过一个统一的Transformer架构,使用文本、图像和代码混合模态完成训练,并且对图像进行分词化,生成交错的文本和图像序列。
Chameleon模型的创新之处在于其早期融合方法,所有处理流程从一开始就映射到一个共同的表示空间,让模型能够无缝处理文本和图像。它在各种任务上展示了广泛的能力,包括视觉问答、图像标注、文本生成、图像生成和长形式混合模态生成。在图像标注任务上,Chameleon达到了最先进的性能,并且在文本任务上超越了Llama-2,与Mixtral8x7B和Gemini-Pro等模型竞争。
论文地址:https://arxiv.org/pdf/2405.09818
Chameleon模型在技术上面临了重大挑战,Meta的研究团队引入了一系列架构创新和训练技术。例如,他们开发了新的图像分词器,基于8192大小的codebook,将512×512的图像编码为1024个离散的token。此外,Chameleon使用了sentencepiece开源库训练的BPE分词器。
在预训练阶段,Chameleon使用了混合模态数据,包括纯文本、文本-图像对以及文本和图像交错的多模态文档。预训练分为两个阶段,第一阶段无监督学习,第二阶段混合更高质量的数据。
Chameleon模型在基准评估中全面超越了Llama2,在常识推理、阅读理解、数学问题和世界知识领域都取得了显著的效果。在人工评估和安全测试中,Chameleon-34B的表现也远远超过了Gemini Pro和GPT-4V。
尽管Chameleon缺少GPT-4o中的语音能力,但Meta的产品管理总监表示,他们非常自豪能够支持这个团队,并希望让GPT-4o更接近开源社区。这可能意味着不久的将来,我们可能会得到一个开源版的GPT-4o。
Chameleon模型的发布,展示了Meta在多模态模型领域的重大进展,它不仅推动了多模态模型的发展,也为未来的研究和应用提供了新的可能性。
一周带货上亿元,退货率100%?粉丝开始反向收割网红
一个原本仅50余万粉丝的财经博主(爱理财的小羊,以下简称“小羊”),在一周的时间里带货销售额上亿元,单场累计观看破百万人次,品类既有“带货万金油”一般的泡脚凤爪,也不乏售价超1.9万元的顶级尖货“整箱茅台”。看上去,这是不断刷新行业认知的直播造神故事的新篇,直到当事主播晒出后台的退款金额——接近100%的退货率。部分单日成交金额、和某阶段的累计退款金额图片来源于小羊个人抖音账号站长网2023-11-08 09:42:350001ChatGPT高三考试仅物理得零分 张朝阳:原创内容很重要
快科技6月1日消息,ChatGPT一经发布就风靡全球,未来的前景被人一致看好。近日,在搜狐的创作者大会上,在场嘉宾讨论了ChatGPT对知识直播领域的影响。同济大学物理教授吴於人称:有人把高三的卷子弄到上面去给他们做选择题,ChatGPT做下来的时候,英语、历史、文字性的东西都考的非常好,成功率非常高,但是只有物理得零分。”0000AI批量生成爆款文章一天2小时、1年赚15万 真相来了
快科技5月9日消息,随着生成式AI技术的兴起,有人称可以利用AI技术批量生产爆款文章,声称每天只需1-2小时,一年就能赚取15万元。对此,微信公众平台运营中心发布声明提醒,部分公众号利用AI技术作为卖点,宣称能够批量生成或制造爆款文章。然而,实际上这些公众号是通过夸大其词、宣传与实际情况不符的收益或成果,以诱导用户购买相关课程或服务。站长网2024-05-10 10:02:100000基于Llama 2的日语LLM发布,参数量达70亿、可与GPT3.5匹敌
文章概要:1.ELYZA发布了基于Meta的Llama2的日语LLM「ELYZA-japanese-Llama-2-7b」,参数数量达到70亿,性能媲美GPT3.5。2.该模型经过追加事前学习和独特的事后学习,性能在5级手动评估中获得最高分,尽管还未达到封闭型LLM的水平,但已经与GPT3.5相匹敌。站长网2023-09-11 15:27:510001身家超1060亿美元!英伟达CEO黄仁勋超戴尔成全球第13大富豪
快科技6月8日消息,据媒体报道,彭博亿万富翁指数显示,英伟达创始人、CEO黄仁勋身家周五超过个人电脑先驱迈克尔戴尔,成为全球第13大富豪,净资产达1061亿美元。随着人工智能芯片需求推动英伟达股价飙升,黄仁勋财富今年激增超过620亿美元,戴尔目前净资产为1059亿美元。此前业界预计,黄仁勋最快有望在2025年前超越特斯拉CEO马斯克,成为全球首富。0000