谷歌 DeepMind 推出 NaViT 模型可显著减少训练时间

站长网2023-07-18 06:37:251阅

最近，Google DeepMind 推出了 NaViT:一种新的 ViT 模型，它在训练过程中使用序列打包来处理任意分辨率和宽高比的输入。该模型将图像分割成小块，并线性投影到令牌上，形成了这个模型的基础。

之前的研究已经探讨了与这个模型不同的可能性:FlexiViT 允许连续范围的序列长度，并通过在每个训练迭代中随机选择补丁大小，并使用缩放技术来适应初始卷积嵌入中的多个补丁大小。Pix2Struct 的替代补丁方法在图表和文件理解等任务中非常有价值。

NaViT 是谷歌研究人员开发的另一种替代方案，它采用了 Patch n' Pack 技术，通过将多个来自不同图像的补丁打包到一个序列中，实现了不同分辨率的同时保持宽高比。NaViT 在广泛的解决方案范围内都表现出色，为推理时间提供了平滑的性能 - 成本平衡，并且易于适应新任务，而且无需花费大量资金。

谷歌 DeepMind推出 NaViT模型 可显著减少训练时间

0001

评论列表

共(0)条

相关推荐

理想L系SUV限时福利来了：至高优惠1.6万外加3年0息贷
快科技2月28日消息，理想汽车针对L系SUV四款车型发布了最新限时福利优惠，最高可享尾款减免1.6万元，并叠加3年0息贷款金融政策。具体来看：理想L6，尾款可享立减1万元，3年贷款节省1.5万元，共节省2.5万元。理想L7，尾款可享立减1.2万元，3年贷款节省1.8万元，共节省3万元。理想L8，尾款可享立减1.2万元，3年贷款节省2.0万元，共节省3.2万元。
站长网站长资讯2025-03-03 07:30:21
0002
站长资讯
戴尔宣布与 Meta 合作推动 Llama 2 大语言模型的本地部署
站长之家(ChinaZ.com)11月1日消息：戴尔公司宣布与Facebook的母公司Meta合作，旨在简化客户在本地部署Llama2大语言模型（LLM）的过程，而不是通过云服务访问。戴尔表示，存在一个企业客户市场，他们希望使用自己的IT基础设施部署和运行Meta的AI模型，戴尔的目标是成为该设备的首选提供商。
站长网2023-11-01 11:29:48
0003
站长资讯
Monster API:简化开源模型调优与部署的人工智能计算基础设施
本文概要:-MonsterAPI，一个专注于生成人工智能（AI）的计算基础设施，旨在简化开源模型的调优和部署。-引述了Twitter用户Santiago对2024年强调将2023年强大AI模型平滑整合到各种应用程序中的重要性的言论。-分析了开源模型和闭源模型的优势差异，以及对开源模型的调优和部署可能存在的挑战。
站长网2024-01-01 11:51:45
0000
站长资讯
一站式代码格式化工具Biome开源可在几秒内格式化JSON代码
Biome是一个用于构建和维护Web项目的现代化工具链。它支持JavaScript、TypeScript、JSON和CSS等主流Web开发语言，能够在短短几秒内对JavaScript、TypeScript、JSON和CSS代码进行格式化和检查。项目地址:https://github.com/biomejs/biome
站长网2023-09-05 11:27:32
0000
站长资讯
金华站竟有网约车候车厅实时显示到场车辆！网友：建议全国推广
日前，网友上传视频显示，浙江金华火车站还设有网约车候车室，方便旅客在此等候网约车。视频中，网约车候车室内不仅有候车椅子，旁边还设有抓娃娃机等娱乐设施。并且，旅客前方墙壁上挂有屏幕，实时显示到场的网约车，能够及时提醒旅客车辆抵达。据此前报道，金华站网约车候车室的工作人员介绍，有了专属上车点”，碰到刮风下雨，旅客就不必提着行李满大街去寻找司机，而是可以不出站在地下停车场坐上网约车。
站长网2023-07-26 21:45:30
0000