视频处理利器Cutie 一键实现超精确的对象分割
Cutie是一种用于自动识别和追踪视频中特定物体的技术。它具有高级的对象理解能力,可以识别整个物体的形状和特性,而不仅仅是像素级的信息。同时,它还能够精确地将目标物体从背景物体中分离出来。
无论在复杂场景中还是在有多个物体和复杂背景的视频中,Cutie都可以准确地进行对象分割。虽然功能强大,但它的运行速度也相当快,适用于需要实时处理的应用场景。
论文地址:https://hkchengrex.com/Cutie/
Cutie的工作原理如下:首先,在视频的第一帧中,Cutie会找到并记住你想跟踪的物体的位置和形状。然后,它会存储物体的详细像素信息,就像给物体拍了一张身份证照片。
当视频继续播放时,Cutie会使用之前记住的信息快速找到物体,并用存储的详细信息来精确确认物体的位置和形状。Cutie同时使用粗略特征和详细信息,所以它能在视频中快速而准确地找到并跟踪物体。这样,无论物体如何移动或变化,Cutie都能准确地追踪它,这在安全监控、自动驾驶车辆或医学研究等领域非常有用。
Cutie主要采用了对象级别的内存读取能力。与传统的像素级内存读取方法不同,Cutie使用一种自上而下的对象级内存读取方式,这可以提高在复杂数据集上的性能。Cutie使用对象变换器与底层像素特征进行交互,这些对象变换器作为目标对象的高级摘要,而高分辨率的特征图用于精确的分割。
此外,Cutie还引入了前景-背景掩码注意力机制,使得部分对象查询只关注前景,其余部分只关注背景,从而更清晰地分离前景对象和背景的语义。除了像素内存外,Cutie还引入了一个紧凑的对象内存,用于总结目标对象的特征,从而实现了目标对象的有效长期表示。
在实际评估中,使用MOSE标准测试,Cutie的性能比XMem方法提高了8.7分。与DeAOT方法相比,Cutie获得了4.2分的高分,并且处理速度比DeAOT快三倍。
总的来说,Cutie是一种功能强大的对象识别和追踪技术,可以应用于各种场合,包括自动驾驶、视频编辑和安全监控等。它的高级对象理解和精确分割能力使其在复杂场景中表现出色,并且其快速准确的特点使其适用于实时处理的需求。通过采用对象级别的内存读取和前景-背景掩码注意力机制,Cutie在性能和效果上都有很大的提升。
网信办:处理超100万人个人信息者应每年开展信息保护合规审计
8月3日,国家网信办就《个人信息保护合规审计管理办法(征求意见稿)》公开征求意见,意见反馈截止时间为2023年9月2日。其中提出,处理超过100万人个人信息的个人信息处理者,应当每年至少开展一次个人信息保护合规审计;其他个人信息处理者应当每二年至少开展一次个人信息保护合规审计。站长网2023-08-03 11:37:230000极氪汽车6月交付10620辆 同比增长146.9%
吉利控股旗下高端智能电动品牌极氪宣布,6月公司交付10620辆,同比增长146.9%,环比增长22.4%。截至目前,极氪品牌累计交付12万台。据悉,极氪品牌旗下有极氪001、极氪009、极氪X三款车型。站长网2023-07-02 10:12:390000雷军:小米将公布智驾突破技术 明年汽车研发投入超300亿
快科技10月19日消息,在2024世界智能网联汽车大会,小米集团的董事长雷军表示,小米SU7将在本月全力冲刺2万辆的交付量。大会上,小米集团创始人、董事长雷军在演讲中表示,小米汽车2024研发投入预计达到240亿元,明年预计投入超过300亿元。雷军还称,在智驾方面,小米的目标是今年年底进入智能驾驶第一阵营,很快小米会公布在智能驾驶方面的进展和突破。0000抖音将进一步扩大“小时达”测试范围
据Tech星球报道,抖音小时达的测试范围将进一步扩大,此前曾在深圳等试点城市提供小时达服务,近期已经扩大至武汉、天津等城市的部分生鲜果蔬商家。如本来鲜、叮咚买菜、物美超市已经开始在抖音内推出一小时果蔬配送服务,而且相关的配送商品已经上架至商家的抖音号内。站长网2023-04-26 18:11:320000谷歌数学版Gemini破解奥赛难题,堪比人类数学家!
【新智元导读】I/O大会上,谷歌Gemini1.5Pro一系列更新让开发者们再次沸腾。最新技术报告中,最引人注目的一点是,数学专业版1.5Pro性能碾压GPT-4Turbo、Claude3Opus,成为全球最强的数学模型。四个月的迭代,让Gemini1.5Pro成为了全球最强的LLM(几乎)。站长网2024-05-21 01:25:520000