谷歌 DeepMind 推出 NaViT 模型 可显著减少训练时间
站长网2023-07-18 06:37:251阅
最近,Google DeepMind 推出了 NaViT:一种新的 ViT 模型,它在训练过程中使用序列打包来处理任意分辨率和宽高比的输入。该模型将图像分割成小块,并线性投影到令牌上,形成了这个模型的基础。
之前的研究已经探讨了与这个模型不同的可能性:FlexiViT 允许连续范围的序列长度,并通过在每个训练迭代中随机选择补丁大小,并使用缩放技术来适应初始卷积嵌入中的多个补丁大小。Pix2Struct 的替代补丁方法在图表和文件理解等任务中非常有价值。
NaViT 是谷歌研究人员开发的另一种替代方案,它采用了 Patch n' Pack 技术,通过将多个来自不同图像的补丁打包到一个序列中,实现了不同分辨率的同时保持宽高比。NaViT 在广泛的解决方案范围内都表现出色,为推理时间提供了平滑的性能 - 成本平衡,并且易于适应新任务,而且无需花费大量资金。
0001
评论列表
共(0)条相关推荐
微软为奇特的人工智能背包申请专利 背包布满传感器可收听语音提示指令
站长之家(ChinaZ.com)9月4日消息:微软公司似乎计划推出一款充满传感器、人工智能驱动的背包专利,这款背包可以检测你的声音发布的指令。该专利上周获得美国专利局的批准,首先被MSPowerUser博客发现,不过该背包的一些规格非常奇怪,其中包括该可穿戴设备可能能够检测用户语音并提供建议,类似Siri,还可以出于某种原因记录和存储用户声音。站长网2023-09-04 09:00:300000WeWork中国:WeWork中国是独立品牌 与WeWork申请破产无关
据国外媒体报道,美国“联合办公空间”公司WeWork计划最早在下周申请破产。WeWork创办于2010年,一度被誉为“未来办公空间的代表”。消息发布后,“共享办公”这种商业模式受到广泛关注和讨论,WeWork股票价格在当天盘后交易中下跌32%。然而,WeWork中国似乎未受影响。在2020年全面实现本土化运营后,WeWork对中国市场积极布局,今年分别在武汉、上海、北京陆续开幕新社区。站长网2023-11-07 14:50:400000清华AIR开源轻量版生物医药基础模型BioMedGPT
日前,清华智能产业研究院(AIR)开源轻量版BioMedGPT1.6B。据悉,BioMedGPT-1.6B是一个参数为16亿的生物医药领域轻量级科研版基础模型,具有跨模态与知识融合的特点,可以处理药物性质预测、自然语言类、跨模态等多种任务。BioMedGPT-1.6B是清华智能产业研究院(AIR)团队正在做的BioMedGPT的单机轻量版,后者是一个适用于生物医药领域研发的通用大模型。站长网2023-04-21 10:14:380000被偷跑的《黑神话:悟空》们,拿什么回击泄密者?
和近年来的所有热门游戏一样,万众瞩目的《黑神话:悟空》也没能逃过泄密。就在正式发售前夕,几段几十秒长度的游戏视频开始在互联网上传播,四散于各个群聊和视频平台。尽管游戏科学针对相关泄密采取了一定补救手段,但想要彻底阻断其民间传播,放在网络环境无比复杂的当下恐怕并不容易。站长网2024-08-22 08:57:400000淘宝直播上线“捧场购”,淘宝内容化战略进展如何了?
每逢大促,淘宝在内容化上的动作更加频繁。618前,部分商家店铺出现一个“内容首页”,这在淘系内部被称为“店号一体”。而在618期间,淘宝直播上线“捧场购”新功能,大力支持内容直播。内容化是淘宝近年来最重要的战略之一,在经历多个大促“大考”之后,淘宝的内容生态究竟如何了?淘宝直播打响声量战今年618,淘宝直播在提高市场声量方面更加努力。站长网2023-07-04 16:18:060002