在线视频实例分割技术TCOVIS 可保持时间一致性
站长网2023-09-26 17:16:290阅
研究人员介绍了一种名为TCOVIS的在线视频实例分割技术,该技术注重时间一致性。实例分割是计算机视觉领域的一个热门研究课题,其目标是将视频帧中的每个独立实例进行识别和分割。
TCOVIS的核心创新在于提出了一个时序一致性模块。视频实例分割是一个非常具有挑战性的任务,因为需要对每一帧图像进行语义分割,同时跟踪并关联各帧之间的目标实例。但是由于各帧之间存在遮挡、形变等问题,使得直接应用图片实例分割模型往往无法获得时序一致和连续的结果。

论文地址:https://arxiv.org/pdf/2309.11857v1.pdf
项目地址:https://github.com/jun-long-li/TCOVIS
TCOVIS通过构建一个记忆模块来实现时序一致性。该模块存储历史帧的特征,并与当前帧建立匹配,从而关联当前帧与之前帧之间的同一实例。 Memory模块采用字典学习的策略,以降低存储和搜索时间成本。同时,TCOVIS还设计了在线训练和模型自监督策略,使框架能够适应视频中新出现的实例,实现真正的在线逐帧分割。
经过实验验证,TCOVIS相比其他主流方法,能够取得更好的时间一致性指标,同时保持与SOTA方法相当的分割精度。该框架可以部署在资源受限的边缘设备上,实现实时高质量的视频实例分割。
0000
评论列表
共(0)条相关推荐
工程师利用GPT-4,实现对 AI 可穿戴设备进行编程
ProjectRing是一款腕戴式小型计算机,它使用AI实时分析环境,并进行文本描述,再通过ChatGPT对环境进行评估。这款可穿戴设备结合了语言和图像模型,以提供人与AI之间更流畅的交互体验。根据开发人员MinaFahmi的说法,该项目旨在“展示低摩擦交互,将人类与人工智能之间的物理和数字信息融合在一起。”站长网2023-05-19 16:23:050000周鸿祎回应睡觉被雷军瞪:着急要不要叫醒自己
360集团董事长周鸿祎最近发布了一段视频,回应了一张在网络上广泛传播的照片。照片中显示他在一次会议上睡觉,而雷军则在旁边注视着他。周鸿祎解释说,这张照片拍摄于2015年乌镇世界互联网大会期间。他回忆称,前一天晚上他参加了丁磊的家宴并喝了酒,结果第二天非常困倦。在当天下午的会议上,他和雷军都安排了发言。由于前面的演讲者拖堂,他在等待期间不小心睡着了。站长网2024-07-26 17:58:080000504,Gateway,Time-out
快科技6月22日消息,在今年的WWDC24上,苹果正式发布AppleIntelligence。据悉,AppleIntelligence拥有生成图片、回答问题、编写代码、润色文章、识别笔迹等功能,并支持Siri横跨多个APP执行复杂操作,相当于从单线程”变成多线程”,甩脱人工智障”的帽子。0002把大模型装进手机,分几步?
大模型“跑”进手机,AI的战火已经从“云端”烧至“移动终端”。“进入AI时代,华为盘古大模型将会来助力鸿蒙生态。”8月4日,华为常务董事、终端BGCEO、智能汽车解决方案BUCEO余承东介绍,通过盘古大模型的底层技术,HarmonyOS带来了下一代智能终端操作系统。站长网2023-08-08 09:05:220000网易云十年听歌报告发布!网易云音乐正式上线十周年
今年是网易云音乐上线的第十周年,为此今日网易云上线了「十年听歌报告」,用户可以在网易云音乐APP搜索「十年报告」查收。在报告中,网易云音乐会统计出用户2017年至2023年的每个年度最爱的音乐,以及每个季度最喜欢的音乐。同时还会生成一个名为「十年精选辑」的歌单。据悉,网易云音乐是一款由网易开发的音乐产品,该产品2013年4月23日正式发布。站长网2023-04-21 14:23:060001