DeepMind验证卷积神经网络在大规模数据集上可媲美视觉变换器
核心要点:
1. 最近的研究表明,卷积神经网络(ConvNets)在大规模数据集上可以与视觉变换器(Vision Transformers)媲美,挑战了以往认为视觉变换器在这方面具有卓越性能的观点。
2. 研究团队使用NFNet模型在巨大的JFT-4B数据集上进行了训练,发现随着计算资源的增加,ConvNets的性能可以与视觉变换器相匹敌,达到了令人印象深刻的ImageNet Top-1准确度。
3. 该研究突出了计算资源和可用于训练的数据量是影响模型性能的主要因素,以及ConvNets,特别是NFNet架构,具备在以往认为是视觉变换器领域的规模上竞争的能力。
最新研究表明,卷积神经网络(ConvNets)在大规模数据集上能够与视觉变换器(Vision Transformers)媲美,挑战了以往认为视觉变换器在这方面具有卓越性能的观点。在计算机视觉领域,ConvNets一直以来都是在各种基准测试中取得卓越性能的标准。然而,近年来,视觉变换器逐渐崭露头角,逐渐超越了ConvNets。有许多专家认为ConvNets在小到中等规模数据集上表现出色,但在面对大规模数据集时,视觉变换器占据了优势。
论文地址:https://arxiv.org/pdf/2310.16764.pdf
一项由Google DeepMind的研究团队进行的新研究挑战了视觉变换器在规模上具有卓越扩展能力的普遍观点。该团队对一种纯粹的ConvNet架构进行了全面评估,这种架构被称为NFNet模型,该模型在大规模数据集上进行了预训练。研究结果显示,ConvNets在大规模数据集上确实可以与视觉变换器相匹敌。
研究团队在巨大的JFT-4B数据集上训练了各种深度和宽度不同的NFNet模型。这个数据集包含大约40亿张图像,涵盖了3万个类别。在对预训练的NFNet模型进行50个时代的微调后,ImageNet Top-1误差在与预训练时使用的计算资源的直接相关性下持续改善。最大的模型,被称为F7 ,在可比较的计算预算下达到了与预训练的视觉变换器报告的性能相当的ImageNet Top-1准确度,达到了惊人的90.3%。
为了更清楚地了解验证损失与预训练计算之间的关系,研究团队绘制了每个模型所需计算预算结束时的验证损失。这个练习揭示了一个明显的线性趋势,与支配验证损失和预训练计算的对数缩放定律一致。随着计算资源的增加,最佳模型大小和训练时期的预算也随之增加。此外,人们还注意到,调整ConvNets的一个可靠经验法则是按比例调整模型大小和训练时期的数量。
有趣的是,研究人员还调查了NFNet系列的三种不同模型(F0、F3、F7 )在一系列时期预算下的最佳学习率。他们的研究结果表明,当受到较小的时期预算限制时,所有这些模型都表现出相似的最佳学习率(约为1.6)。然而,随着时期预算的增加,最佳学习率减小,较大的模型经历了更快的下降。
总的来说,这项研究强调了在计算机视觉领域,合理设计的模型性能的主要因素是计算资源和可用于训练的数据量。从这项工作中可以明显看出,ConvNets,特别是NFNet架构,具备在以往认为是视觉变换器领域的规模上竞争的能力。这些结果突显了同时扩展计算和数据资源的重要性,为计算机视觉研究的未来带来了新的启示。
「联网」ChatGPT:一个不完美的新闻助手
ChatGPT打破“数据截至2021年”的枷锁,成功连接上网的信息一经发布,便引发媒体圈的好奇与围观。9月27日,OpenAI公司宣布ChatGPT向付费用户提供互联网浏览版本,付费用户可以通过微软的搜索引擎Bing联网获取最新信息,这打破了ChatGPT数据库截至2021年9月的限制。在此之前,用户无法通过ChatGPT访问互联网的最新信息。000000后已经开始有立遗嘱意识:微信遗嘱数量也逐渐增加
3月21日,中华遗嘱库发布了2023年度《中华遗嘱库白皮书》,显示了遗嘱咨询和登记保管数量的增长趋势。数据表明,遗嘱人群平均年龄逐渐下降,年轻人对订立遗嘱的意识增强。从2017年至2023年,中青年人订立遗嘱的数量大幅增加,包括80后、90后和00后。站长网2024-03-22 02:32:070001特斯拉 2021 年 AI Day 发布的 Optimus 机器人迄今为止只制造了「5 或 6」个
特斯拉更新了Optimus机器人的生产数量,公司正在继续开发其第一个人形机器人,并解释了为什么该数字可能没有达到一些人的预期。在日前特斯拉2023年第二季度财报电话会议上,一位散户投资者询问了Optimus机器人的生产数量,并要求提供关于该机器人在2021年年底AIDay上发布后的进展情况。站长网2023-07-21 22:57:570001一个“视品牌”的突围:押注视频号,合作几百位达人,年GMV近3亿
视频号会像淘宝、抖音一样拥有自己的“视品牌”吗?在慕江南创始人周大帅看来,慕江南就是典型的“视品牌”。自2021年入局视频号,慕江南几乎完整见证了视频号电商的发展。2023年,慕江南在视频号的累计GMV近3亿元,占总业绩的65%。0000荣耀X50 Pro上架:售价2799元 搭载骁龙8+处理器
荣耀官网已经上架了全新的荣耀X50Pro手机,这款手机将于1月4日19:30正式发布。该机配备了12GB内存和256GB存储空间,售价为2799元。荣耀X50Pro搭载了高通的骁龙8处理器,这款处理器采用台积电4nm制程工艺,具有强大的性能表现。其CPU由13.2GHz2、32.75GHzA710、42.0GHzA510组成,而GPU为Adreno730900MHz。0000