SAM模型加速变体EdgeSAM 比原始SAM提速40倍
站长网2023-12-14 12:10:343阅
EdgeSAM是一个优化过的SAM变体,相比原始SAM实现了40倍的速度提升,对性能的影响较小,可以在iPhone14上以30帧每秒的速度运行。
该方法将原始的基于ViT的SAM图像编码器提炼成纯CNN架构,更适合边缘设备。通过仔细评估各种提炼策略,研究人员证明了任务不可知的编码器提炼无法捕捉SAM所蕴含的全部知识。

地址:https://mmlab-ntu.github.io/project/edgesam/
为了克服这一瓶颈,他们在提炼过程中包括了提示编码器和蒙版解码器,循环中还有框和点提示,以便提炼模型能够准确捕捉用户输入和蒙版生成之间的复杂动态。此外,为了减轻点提示提炼带来的数据集偏差问题,研究人员在编码器中加入了一个轻量级模块。
关键的见解是在知识蒸馏过程中考虑提示,以便学生模型接收任务特定的指导,并专注于更难的训练目标,比如更精细的边界。
为此,引入了一种动态提示采样策略,旨在实现三个关键目标:从初始提示(无论是框还是点)动态生成多样化的提示组合,准确识别学生模型在掩模内表现不准确的区域,从而引导其专注于这些特定的部分,并促使教师模型,即SAM,产生更高质量的掩模,以提供更精确的指导。
0003
评论列表
共(0)条相关推荐
会员暂停后也播放全屏广告 网友吐槽:爱奇艺回应让人更无奈
快科技10月5日消息,近日有网友发帖称,爱奇艺会员暂停后播放全屏广告真是忍不了,对此官方也进行回应。有网友发视频称,自己身为爱奇艺的会员,但在观看视频的过程中点击暂停想要观察画面,暂停后却出现了全屏的广告,被暂停的视频仅占屏幕小小一角,根本无法看清。随后,爱奇艺客服表示:爱奇艺会员特权仅减免部分视频前面的广告,在使用期间仍会遇到其他形式的广告可以点击关闭和跳过之类的按钮。0000TextBase:简易且更懂人话的AI聊天机器人框架
最近,在GitHub上出现了一款名为“TextBase”的产品,这引起了用户的广泛关注。TextBase是一款简单的框架,用于构建AI聊天机器人,它可以帮助开发人员快速搭建和优化聊天机器人。项目地址:https://github.com/cofactoryai/textbase站长网2023-09-05 11:07:290000Al加码,引爆“躺平式”旅游
今年的五一,“微度假”“微旅行”纷纷出圈。相较于三亚、云南等老牌旅游大热门,人们开始寻找一些不用“人挤人”的小众旅行目的地:数据显示,更多游客愿意来到小城市旅游。根据在线旅游平台数据,今年“五一”假期,县域市场酒店预订订单同比增长68%,景区门票订单同比增长151%,增速高于全国大盘。站长网2024-05-06 20:36:050000福布斯发布2023年AI50榜单:OpenAI、谷歌云、AWS等上榜
今日,福布斯发布2023年AI50榜单,它是由美国福布斯杂志、SequoiaCapital和MeritechCapital联合评选的榜单,旨在表彰最有前途的使用人工智能进行商业应用的未上市公司。站长网2023-04-14 15:17:450002复旦大学云上科研智算平台上线 支持千亿参数大模型加速运行
在今日的复旦大学智能计算平台暨首届科学智算高端论坛上,国内高校最大的科研智能计算平台CFFF的“切问”一号和“近思”一号在复旦大学正式上线。这一新型的“大科学装置”能够高效地进行超千卡的并行智能计算,并支持千亿参数的大模型加速运行。在上线仪式上,复旦大学与阿里巴巴集团、中国电信分别签署了战略合作协议,共同建设全国高校中算力最强的专用高性能智能计算平台。站长网2023-06-28 09:26:540000