Meta推出像素级动作追踪模型,简易版在线可玩 | GitHub 1.4K星
视频动作跟踪,已经精确到了每个像素!
Meta最新推出的视频跟踪工具CoTracker,发布没多久就在GitHub上斩获了1.4k星标。
从官方发布的几个DEMO来看,效果还是很震撼的。
一场马术比赛中,马匹在骑手的操纵下优雅地跨过障碍,画出了优美的弧线。
还有一架帆船乘风破浪,仿佛捉住了风的影子。
另一边,一位跳伞运动员从空中划过,留下了一道绚丽的彩虹……
对这个新“玩具”,有网友评论说,它不仅能改变物体追踪技术,也将在体育(动作)分析、野生动物追踪,甚至电影后期领域掀起一场新的革命。
我们也第一时间上手试玩了一下线上的简易版本,下面就一起来看看吧。
精准记录像素轨迹
首先有请四川知名网红、熊猫界的当红炸子鸡“果赖”隆重登场。
只见花花六亲不认的步伐被CoTracker整个记录了下来,真的是太可爱了。
不过要论戏剧性的话,可能还得是我们的“西直门三太子”萌兰。
看完了可爱的胖达,接下来就要进入整活环节了,来点名场面!
这个就不用再多介绍了吧(确信)。
除了上面的这位老朋友,还有王境泽吃炒饭的镜头。
只见他手上诚实的动作在CoTracker面前暴露无遗。
而在地球的另一边,马斯克正在直播用FSD开着特斯拉去找小扎,准备进行一番亲切友好的交流。
CoTracker的效果就展示到这里了,朋友们如果想看其他效果可以自己玩玩看。
传送门:
https://huggingface.co/spaces/facebook/cotracker
不过,在线DEMO是个简易版本,还不支持自定义跟踪位置,只能根据输入的跟踪数量等距分配。
但是如果自己部署、用代码操纵的话,就可以设置任意跟踪点了。
说到这我们正好来看一下CoTracker该怎么部署。
首先是Colab版本,我们刚刚说到的自定义跟踪点也在Colab当中。
传送门:
https://colab.research.google.com/github/facebookresearch/co-tracker/blob/master/notebooks/demo.ipynb
Colab的过程不必过多介绍,进入之后运行笔记中的代码就可以了。
而如果想自己动手的话,最简单的方式是从torch.hub中直接调用已完成预训练的版本。
pipinstalleinopstimmtqdmimporttorch
importtimm
importeinops
importtqdm
cotracker=torch.hub.load("facebookresearch/co-tracker","cotracker_w8")
如果要对模型进行评估或训练,那么使用GitHub Repo更为合适。
首先要安装一下程序和相关依赖:
gitclonehttps://github.com/facebookresearch/co-tracker
cdco-tracker
pipinstall-e.
pipinstallopencv-pythoneinopstimmmatplotlibmoviepyflow_vis
然后下载模型:
mkdircheckpoints
cdcheckpoints
wgethttps://dl.fbaipublicfiles.com/cotracker/cotracker_stride_4_wind_8.pth
wgethttps://dl.fbaipublicfiles.com/cotracker/cotracker_stride_4_wind_12.pth
wgethttps://dl.fbaipublicfiles.com/cotracker/cotracker_stride_8_wind_16.pth
cd..
有关评估和训练的方式,可以到GitHub项目页来查看,链接放在了文末。
那么,CoTracker又是怎么实现像素级追踪的呢?
评分超过DINOv2
虽然都是追踪,但CoTracker和物体追踪模型有很大区别。
CoTracker并没有基于语义理解对视频中物体进行分割的过程,而是把重点放在了像素点上。
底层方面,CoTracker采用了Transformer架构。
Transformer编码了视频中点的跟踪信息,并迭代更新点的位置。
推理上,CoTracker还采用了一种窗口机制,在时间轴上划分出滑动窗口。
CoTracker使用上个窗口的输出对后面的窗口进行初始化,并在每个窗口上运行多次Transformer迭代。
这样就使得CoTracker能够对更长的视频进行像素级跟踪。
总之,经过一番训练之后,CoTracker取得了一份不俗的成绩单。
在FastCapture数据集测试上,CoTracker的成绩在一众模型中脱颖而出,其中也包括Meta自家的DINOv2。
总之,喜欢的话,就赶紧体验一下试试吧!
论文地址:
https://arxiv.org/pdf/2307.07635.pdf
GitHub项目页:
https://github.com/facebookresearch/co-tracker
—完—
AI创企竹间智能宣布停工停产! 公司:重组调整,确保长期发展
据媒体报道,2月22日,AI创业公司竹间智能被曝出现停工停产情况,有传闻称停工时间长达六个月。对此,竹间智能高层回应称,停工停产面向的仅为部分亏损业务,而新的数字人产品研发工作仍在继续。此前,有网传截图显示,竹间智能部分业务和岗位将从2月20日起停工停产,直至8月19日。对此,竹间智能高管明确表示,该停工通知仅针对个别业务线,不是公司整体范围的安排。站长网2024-02-22 09:34:230001新东方及东方甄选捐1000万驰援甘肃
12月18日23时59分,甘肃省临夏回族自治州积石山县发生6.2级地震,震区发生人员伤亡,灾情牵动了全国人民的心。对此,新东方及东方甄选宣布捐款1000万元,驰援甘肃地震灾区。新东方表示,新东方教育科技集团及旗下农产品电商平台东方甄选紧急响应,各捐款500万元,合计1000万元,用于支援甘肃震区的紧急救援、救灾物资采购、受灾群众生活安置及灾后重建等工作。站长网2023-12-19 14:37:360000亚马逊推出全新免费AI培训课程,帮忙提升生成式AI技能
**划重点:**1.🎓亚马逊推出“AIReady”计划,旨在到2025年为全球200万人提供GenerativeAI职业所需的技能。2.💻提供免费的GenerativeAI培训课程,涵盖专业人士和初学者,以及面向高中和大学学生的奖学金计划。站长网2023-11-21 11:15:110000努比亚Z60 Ultra首销数据出炉 销售额1秒破亿
今日上午10:00,备受瞩目的努比亚Z60Ultra手机正式开售。根据努比亚官方发布的首销战报,该手机全渠道首销销售额一秒破亿,更是获得了京东安卓手机销售额第一的佳绩。作为一款配置强大的新机,努比亚Z60Ultra在技术方面也有许多亮点。它搭载了第五代屏下摄像技术,使得屏下位置的透明度得到提升,并配备了业界最大的前摄单像素感光面积,让拍照更加细腻清晰。0000Midjourney V5.1发布:提示词设置更简单、禁用词审核更智能
日前,Midjourney上线了Midjourney5.1版本,其旨在通过简单的提示提供更好的结果,同时开发人员还添加了一个新的审核系统。更简单的提示更高的图片质量Midjourney用户现在可以访问和使用Midjourney5.1,用户可以在Discord设置中启用。根据Midjourney的说法,v5.1比5.0用起来更简单,即使很短提示也应该能提供高质量的图像。站长网2023-05-04 10:41:300003