一键消除视频人物！南科大发布视频分割模型TAM 支持动态物体追踪

站长网2023-05-04 18:11:380阅

特效师的救星来了!近日，南科大发布视频分割模型TAM，可轻松追踪视频中的任意物体并消除，操作简单友好。

TAM的出现为解决传统视频分割模型需要人工标记培训数据和初始化参与数据的问题提供了之前提供，将改变CGI行业的游戏游戏规则。

TAM可应用于视频编辑、虚拟现实、增强现实等领域，具备广泛的应用前景。TAM的出现也将促进视频内容的真实性和可信度，减少一些虚假信息的传播。

TAM是在SAM的基础之上结合记忆力建立时空关联现实的视频分割模型，可应用于多个领域。TAM的训练过程中，SAM的静态图像分割能力对模型进行初始化，XMem进行半人干预训练，再由SAM进行再优化和调整。

TAM的出现将改变传统视频分割模式的工作方式，提供高清视频内容的真实性和可信度。

论文地址:

https://arxiv.org/abs/2304.11968

GitHub页面:

https://github.com/gaomingqi/Track-Anything

一键消除视频人物南科大发布视频分割模型TAM支持动态物体追踪

0000

评论列表

共(0)条

相关推荐

站长资讯
北大视频大模型新SOTA，搞笑抖音视频AI秒懂笑点｜开源
AI能理解搞笑视频笑点在哪里了。AI回答:这个视频之所以搞笑，在于一个小宝宝正坐在床上努力读书，但他显然还不会真正读书。他只是不停地指着书页上的各处，而摄影者则在背后笑他。小宝宝的这种尝试很有趣，因为他在尝试阅读一本对他而言过大的书，也看不懂里面的文字。北大等团队开源视觉语言大模型Video-LLaVA，将图像和视频表示对齐到统一的视觉特征空间，在13个图片和视频基准上达到先进的性能。
站长网2023-11-21 09:15:55
0000
站长资讯
董明珠首次回应孟羽童离职：人在格力还去外面做广告不合规
今年5月，被誉为董明珠接班人的孟羽童离职，此举引发了网络热议。对于离职原因，孟羽童表示是为了准备读研，但董明珠并未对此事进行正面回应。最近，董明珠在接受《财经郎眼》采访时被问及此事，她回应称:“网红不网红看人品质，人在格力去外面做广告是不合规的。”这是董明珠首次对孟羽童离职事件做出正式回应。
站长网2023-11-07 21:35:31
0000
站长资讯
0粉丝带货，也能月入过万
各位村民好，我是村长。我来拍视频，你只要负责上传，在家就能月入上万。包开橱窗、包原创、只要几百块，不想出镜、不拍视频、不会剪辑，我问帮你。相信许多人，都有在抖音上刷到过这样的广告。无数宝妈、普通打工人蠢蠢欲动啊，这不就是我梦寐以求要找的发财项目嘛!总结就是三个字:割韭菜!今天村长就和大家聊聊，关于这种——【视频分发赚钱项目】的一些看法。01视频分发真能带货吗?
站长网2023-06-05 21:29:35
0002
站长资讯
突破算力限制！Meta开源“记忆层”，重塑Transformer架构大模型
今天凌晨3点，全球社交巨头Meta分享了一个创新研究——Memorylayers（记忆层）。目前，Transformer架构的预训练大模型在存储、查询数据时，随着参数的变大对算力的需求呈指数级增长。“记忆层”提出了新的高效查询机制替代了传统的查询方法，通过比较查询键与两个较小集合中的键，可以快速找到最相关的键，而无需遍历模型的整个记忆层。
站长网2025-01-03 14:02:52
0000
站长资讯
苹果开源图像新技术ml-mgie 可通过指令修改图片
苹果开源了一种新的技术，名为多模态大语言模型引导的编辑（MGIE），这项技术能够帮助用户通过自然语言指令来修改图片，使得编辑图片更加简单和自然。MGIE采用多模态大型语言模型（MLLMs）进行图像编辑指令的生成，通过端到端训练，模型不仅捕捉视觉想象力，还执行图像处理操作。该方法在ICLR'24上取得了Spotlight成果。
站长网2024-02-05 09:45:39
0002