Meta 开源计算机视觉基础模型DINOv2
文章概要:
1. Meta公司以Apache2.0许可证发布计算机视觉模型DINOv2开源版本。
2. DINOv2可用于各种计算机视觉任务,是灵活通用的工具。
3. Meta计划将DINOv2与大规模语言模型结合,创造更强大的图像分析系统。
Meta 在 Apache2.0许可下发布其计算机视觉模型 DINOv2,为开发人员和研究人员提供下游任务的更大灵活性。Meta 还发布了一系列基于 DINOv2的密集预测模型,用于语义图像分割和单目深度估计。
Meta 还引入了FACET,这是一个评估计算机视觉模型在分类和分割等任务中的公平性的基准。该数据集包含50,000人的32,000张图像,除了身体特征之外,还具有感知性别和年龄组等人口统计属性。FACET旨在成为评估计算机视觉模型公平性的标准基准,并鼓励设计和开发考虑更多人的模型。

DINOv2是一种自监督学习训练的模型,在各种视觉任务上的表现可与当前主流的专用系统可相媲美甚至更好。该模型可以为下游任务提供更大的灵活性,是一种通用的计算机视觉工具。
DINOv2经过1.42亿张图像的训练,可以直接作为各种视觉任务的输入特征使用,包括图像级任务(图像分类、实例检索、视频理解等)和像素级任务(深度估计、语义分割等)。DINOv2模型可能在各种应用中发挥作用,如森林绘图、动物密度估计、生物学研究等。
DINOv2核心特色功能包括:
基于PyTorch实现的DINOv2自监督学习方法的代码和预训练模型
不需要任何标签或注释即可在包含1.42亿张图像的数据集上进行预训练
产生高性能的视觉特征,可以直接与简单的线性层组合在各种计算机视觉任务上使用
预训练模型效果强劲,在不进行微调的情况下也能跨域泛化
提供多个预训练模型 BACKBONE(ViT-S/14、ViT-B/14等)可通过PyTorch Hub加载
提供了对应预训练任务头,如图像分类、深度估计、语义分割等
代码模块化,可以方便训练、评估和微调
模型和代码均基于Apache2.0许可证开源
Meta公司计划将DINOv2与大规模语言模型相结合,创造出更强大的图像分析和处理系统。语言模型受输入字幕限制,而DINOv2可以为复杂的AI系统提供更丰富的图像信息,实现更深层次的图像推理。DINOv2的开源发布是计算机视觉领域的重要进展。
DINOv2项目网址:https://github.com/facebookresearch/dinov2
FACET官方介绍:https://ai.meta.com/datasets/facet/
OpenAI突发更新!GPT-3.5正式开放「微调」,人人可打造专属ChatGPT|附最全官方指南
【新智元导读】今天,OpenAI正式开放GPT-3.5微调API,GPT-4版本也即将推出。这意味着,继插件「APPStore」大爆发后,所有人皆可以打造个性化的专属「类ChatGPT应用」。终于来了!刚刚,OpenAI正式宣布,所有开发者都可以对GPT-3.5Turbo进行微调。初步结果表明,微调后的GPT-3.5Turbo,在具体任务中,性能与GPT-4实力相当,甚至反超GPT-4。站长网2023-08-25 16:16:020000500万人围观,马斯克直播挂了、X员工惨了
凤凰网科技讯北京时间9月30日,特斯拉公司CEO埃隆马斯克(ElonMusk)周四到访美墨边境,并在X上大搞直播。尴尬的是,他刚刚直播了三分多钟就出现了技术故障,被迫中断。站长网2023-09-30 10:36:330000在即将到来的人工智能就业大浪潮中,最大的赢家和输家是谁?
站长之家(ChinaZ.com)11月2日消息:随着人工智能(AI)的浪潮席卷白领工作领域,近10亿的知识型员工将受到影响,预计将有1400万职位消失。而在这种结构性变化中,一个意想不到的职业群体可能会安然无恙,即蓝领工作。随着老年人的大量退休和对健康保健、绿色能源、高技术制造和建筑等领域需求的增加,蓝领职位有望迎来显著增长。站长网2023-11-02 14:37:170000高通骁龙8 Gen4蓄势待发:主频突破4GHz 性能霸榜安卓阵营
快科技7月18日消息,博主数码闲聊站爆料,高通骁龙8Gen4终端将从10月底开始陆续亮相,其CPU主频突破了4GHz,实测性能超过了竞品天玑9400,这将是安卓阵营性能最强悍的手机芯片。对比骁龙8Gen3,骁龙8Gen4最大变化是放弃了Arm公版架构,采用自研的NuviaPhoenix架构方案,这一全新的CPU架构源自于2021年高通收购的芯片初创企业Nuvia。站长网2024-07-18 17:05:280000Microsoft 365 Copilot 现已面向部分客户推出 起售价 9000 美元
站长之家(ChinaZ.com)11月2日消息:微软近日宣布为企业客户推出Microsoft365Copilot普通版,将人工智能(AI)的能力整合到其产品线中,包括MicrosoftTeams,Outlook,Word,Excel和PowerPoint。站长网2023-11-02 16:02:540000