Meta发布AI图片学习模型I-JEPA:可自我学习推理
Meta的首席人工智能科学家Yann LeCun已经讨论了几年能够在很少或完全不需要人类的帮助下学习世界模型的深度学习系统。现在,这个愿景正在慢慢实现,因为 Meta 刚刚发布了 I- JEPA 的第一个版本,这是一个机器学习 (ML) 模型,通过对图像的自我监督学习来学习世界的抽象表示。
初步测试显示,I-JEPA在许多计算机视觉任务上表现优秀。它也比其他最先进的模型更高效,仅需要训练的计算资源的十分之一。Meta已经公开了训练代码和模型,并将在下周的计算机视觉和模式识别(CVPR)会议上展示I-JEPA。
自我监督学习
自我监督学习的想法受到人类和动物学习的启发。我们很多知识都是通过观察世界获取的。同样,人工智能系统应该能够通过原始观察学习,而无需人类标记他们的训练数据。
自我监督学习已经在一些人工智能领域取得了显著的进展,包括生成模型和大型语言模型(LLMs)。在2022年,LeCun提出了“联合预测嵌入架构”(JEPA),这是一种可以学习世界模型和常识等重要知识的自我监督模型。JEPA在重要方面不同于其他自我监督模型。
生成模型(例如DALL-E和GPT)旨在进行细致的预测。例如,在训练期间,文本或图像的一部分被遮盖,模型尝试预测确切的缺失单词或像素。尝试填补每一个细节的问题是,世界是不可预测的,模型经常陷入许多可能的结果中而无法前进。
相比之下,JEPA不是关注像素级的细节,而是试图学习和预测高层次的抽象,例如场景必须包含什么以及对象如何相互关联。这种方法使模型在学习环境的潜在空间时不易出错,成本也大大降低。
“通过在高抽象级别上预测表示,而不是直接预测像素值,我们希望直接学习有用的表示,并避免了生成方法的局限性,”Meta的研究人员写道。
I-JEPA是LeCun提出的架构的基于图像的实现。它使用“抽象预测目标”来预测缺失信息,可能会消除不必要的像素级细节,从而使模型学习更多的语义特征。
I-JEPA使用Vision Transformer(ViT)对现有信息进行编码,这是一种用于LLM中的Transformer架构的变体,但是对图像处理进行了修改。然后,它将此信息作为上下文传递给预测器 ViT,该预测器为缺失的部分生成语义表示。
Meta的研究人员训练了一个生成模型,用于从I-JEPA预测的语义数据中创建草图。在下图中,I-JEPA在蓝色框外的像素作为上下文,然后预测了蓝色框内的内容。生成模型然后创建了I-JEPA预测的草图。结果显示,I-JEPA的抽象匹配了场景的真实情况。
虽然I-JEPA不会生成写实的图像,但它可以在机器人和自动驾驶汽车等领域中具有许多应用,其中AI机器人必须能够理解其环境并处理一些非常合理的结果。
一个非常有效的模型
I-JEPA的一项明显好处是其内存和计算效率。预训练阶段不需要其他类型的自我监督学习方法中使用的计算密集型数据增强技术。研究人员能够使用16个A100GPU在不到72小时内训练出一个拥有632百万参数的模型,约为其他技术的十分之一。
“经验证明,我们发现I-JEPA可以不使用手工制作的视图仿真来学习强大的即插即用的语义表示,”研究人员写道。
他们的实验表明,I-JEPA在图像分类、物体计数和深度预测等计算机视觉任务中需要远远较少的微调,即可超越其他最先进的模型。研究人员能够使用仅占1%的训练数据在ImageNet-1K图像分类数据集上进行微调,每类仅使用12至13个图像。
“通过使用具有较少刚性感应偏置的更简单的模型,I-JEPA适用于更广泛的任务,”研究人员写道。鉴于互联网上未标记数据的高可用性,I-JEPA 等模型对于以前需要大量手动标记数据的应用程序来说非常有价值。
项目网址:https://ai.facebook.com/blog/yann-lecun-ai-model-i-jepa/
iOS17.2.1被曝无法接打电话、上网 仅限iPhone 15系列用户
站长之家(ChinaZ.com)1月2日消息:近期,iPhone15系列用户在升级至最新的iOS17系统后纷纷反馈,他们的手机出现了无法拨打电话的问题。问题主要出现在升级至iOS17.2.1版本后,用户们纷纷表示,他们的iPhone无法连接到运营商信号,进而导致无法拨打电话或使用蜂窝网络流量。目前,这一问题似乎仅限于最新款的iPhone15系列。0000研究表明:在会计方面,ChatGPT 仍然无法与人类相提并论
上个月,OpenAI推出了其最新的人工智能聊天机器人产品GPT-4。据OpenAI的人员称,这个使用机器学习生成自然语言文本的机器人以90%的分数通过了律师考试,通过了15门AP考试(美国大学先修课程)中的13门,并在GRE语言考试中获得了近乎完美的分数.站长网2023-04-23 10:32:130002贾跃亭回应负面评价:称终有一天FF会回到中国
近日,贾跃亭在一次访谈中终于敞开心扉,谈及了这些年的负面评价。他表示,刚开始确实对此感到生气,但随着时间的推移,他逐渐淡化了这些负面声音,不再过多关注。他坚信“清者自清”,认为随着时间的推移,真相自然会水落石出。站长网2024-05-22 15:11:490000微信宣布动态红包封面开放定制!4步教你发布
快科技1月19日消息,如今,微信抢红包也成了春节假期的一种娱乐。去年春节,微信动态红包封面上线,相比起千篇一律的静态红包封面,酷炫的动态红包封面更加个性。今日,微信宣布,为满足更多个性化定制需求,动态红包封面全面开放定制。怎么发布动态封面?仅需4个步骤:第1步:制作封面素材,电脑端登录微信红包封面开放平台”(https://cover.weixin.qq.com/)。站长网2024-01-19 18:05:420000小米卢伟冰:手机名字加个AI没有意义 天天谈AI证明没AI能力
站长之家(ChinaZ.com)2月27日消息:在最近的世界移动通信大会(MWC2024)上,小米集团总裁、小米品牌总经理卢伟冰发表了一番引人注目的言论。他直言不讳地批评了当前手机市场上的一种趋势:许多手机品牌喜欢在产品名称后加上“AI”二字,以此作为卖点。然而,卢伟冰认为这种做法其实毫无意义,反而暴露出这些品牌缺乏真正的AI能力。站长网2024-02-27 14:49:450002