SAM模型加速变体EdgeSAM 比原始SAM提速40倍
站长网2023-12-14 12:10:343阅
EdgeSAM是一个优化过的SAM变体,相比原始SAM实现了40倍的速度提升,对性能的影响较小,可以在iPhone14上以30帧每秒的速度运行。
该方法将原始的基于ViT的SAM图像编码器提炼成纯CNN架构,更适合边缘设备。通过仔细评估各种提炼策略,研究人员证明了任务不可知的编码器提炼无法捕捉SAM所蕴含的全部知识。
地址:https://mmlab-ntu.github.io/project/edgesam/
为了克服这一瓶颈,他们在提炼过程中包括了提示编码器和蒙版解码器,循环中还有框和点提示,以便提炼模型能够准确捕捉用户输入和蒙版生成之间的复杂动态。此外,为了减轻点提示提炼带来的数据集偏差问题,研究人员在编码器中加入了一个轻量级模块。
关键的见解是在知识蒸馏过程中考虑提示,以便学生模型接收任务特定的指导,并专注于更难的训练目标,比如更精细的边界。
为此,引入了一种动态提示采样策略,旨在实现三个关键目标:从初始提示(无论是框还是点)动态生成多样化的提示组合,准确识别学生模型在掩模内表现不准确的区域,从而引导其专注于这些特定的部分,并促使教师模型,即SAM,产生更高质量的掩模,以提供更精确的指导。
0003
评论列表
共(0)条相关推荐
OpenAI 的六人董事会将决定「我们何时实现 AGI」
站长网2023-11-14 14:58:250000谷歌最新的人工智能大型语言模型 PaLM 2 在训练中使用的文本数据是其前身的近五倍
据CNBC披露,谷歌上周宣布的新型大型语言模型PaLM2使用的训练数据量几乎是2022年前身的5倍,可执行更高级的编码、数学和创意写作任务。据CNBC获悉,谷歌的新通用大型语言模型(LLM)PaLM2已训练了3.6万亿个token。而token是单词字符串,是训练LLM的重要组成,因为它们使模型能够预测序列中接下来出现的单词。站长网2023-05-18 09:29:380000日本 Rapidus 与 Tenstorrent 达成合作 将共同开发 2 纳米 AI 芯片
RapidusCorporation,一家专注于高级逻辑半导体的研究、开发、设计、制造和销售的公司,今天宣布已与专注于人工智能(AI)计算的下一代计算公司TenstorrentInc.达成合作协议,共同开发基于2纳米逻辑半导体的AI边缘设备的半导体知识产权(IP)。站长网2023-11-17 16:44:160001智界S7及华为全场景发布会定档11月28日
华为在今日宣布,将于11月28日举办一场盛大的发布会,主题为“智界S7及华为全场景发布会”。届时,华为的全新车型智界S7将正式上市,预售价为25.8万起,目前已经有超过3万台车预定。智界S7定位于纯电轿跑,车身尺寸为497119631474mm,轴距为2950mm。这款车采用了全新的OneBox造型设计,使得车内空间利用率高达88%。站长网2023-11-22 09:52:580000今天是小米手机13岁生日 雷军:感谢米粉朋友支持与陪伴
今天上午,小米公司创始人雷军通过微博庆祝小米手机13周年纪念日,并向长期以来支持小米的米粉们表达了深深的感激之情。雷军在庆祝帖中动情地说,亲爱的米粉朋友们:今天是小米手机13岁的生日,2011年8月16日,小米手机第一款产品正式发布。自此之后,我们不断探索和进步,只为给大家带来更多优质的科技产品。小米始终坚持让全球每个人都能享受科技带来的美好生活”用影像发现美好、用科技探索美好!站长网2024-08-16 09:13:090000