南方科技大学推出Track Anything模型 实现高性能交互式视频跟踪和分割
站长网2023-07-27 14:01:260阅
Track Anything Model (TAM) 是南方科技大学 VIP 实验室开发的视频跟踪和分割工具。它具有简单直观的界面,能够在一次推断过程中跟踪和分割视频中的任何对象。
TAM 提供了自适应视频跟踪和分割的多种选择,包括快速轻松的视频转录、长期目标观察、简单易用的视频编辑以及可视化和开发视频相关任务的工具包。

项目地址:https://github.com/gaomingqi/track-anything
核心功能:
1. 快速简便的视频转录:TAM 可以分离视频中感兴趣的区域,并允许用户选择他们想要跟踪和分割的对象,适用于视频标注等任务。
2. 长期目标观察:TAM 能够处理频繁镜头变换的长视频,适用于需要进行长期跟踪的实际应用。
3. 简单易用的视频编辑器:Track Anything Model 可以将物体分为不同的类别,并提供对象分割掩码,使用户可以选择性地裁剪或重新定位视频中的任何对象。
4. 视频相关任务的可视化和开发工具包:团队还提供了可视化用户界面,用于各种视频操作,包括视频对象分割、视频跟踪、视频修复等,以方便用户测试模型在真实场景中的效果。
0000
评论列表
共(0)条相关推荐
人工智能可以通过稻田收割前照片估计水稻产量
文章概要:1.建立包含2万多张稻田图像和产量数据的数据库,训练卷积神经网络模型。2.模型可以解释68-69%的产量变异,突出了穗在产量估计中的重要性。3.模型预测准确,成本低且不需要繁琐的作物采样,展示了区域监测产量的潜力。最近,日本冈山大学的研究人员利用收割期拍摄的地面数字图像,结合卷积神经网络模型,实现了对水稻产量的估算。站长网2023-08-26 16:12:12000036岁身价553亿?腾讯网易米哈游等公司老板登上新财富榜单
今日(5月16日),新财富杂志公布了「2023新财富500富人」榜单。其中游戏及相关行业共有12位老板进入榜单,较去年减少4位,这四位分别来自冬海集团、世纪华通和昆仑万维。不仅今年游戏相关行业上榜人数减少,在榜老板们的财富值也基本呈下滑态势(文末有葡萄君整理的榜单排名)。站长网2023-05-17 09:03:020000Runway上线文字生成语音功能 英文效果惊艳
近日,Runway悄悄上线了之前所说的文字生成语音功能。初次尝试英文效果,其自然丰富的情感令人惊叹。然而,中文语音依然存在老问题,带有外国人口音,这一问题可能无法指望外国公司来解决。体验地址:https://app.runwayml.com该功能提供了多种语音模型可供选择,并且目前只需消耗右上角的点数即可生成长时间可用的语音。站长网2023-12-18 18:58:370000消息人士:尽管领导层发生分歧,OpenAI 的收购要约仍将在1月进行
划重点:💡OpenAI的收购要约仍然按计划进行,将为员工提供流动性,估值约为860亿美元。💡这一轮融资由JoshKushner的ThriveCapital领导,但SamAltman的返回解除了之前的不确定性。💡收购的期限已延长至1月5日,OpenAI宣布了Altman和Brockman的回归以及新的董事会成员。<站长网2023-12-01 18:10:330000一句话精准视频片段定位!清华新方法拿下SOTA|已开源
只需一句话描述,就能在一大段视频中定位到对应片段!比如描述“一个人一边下楼梯一边喝水”,通过视频画面和脚步声的匹配,新方法一下子就能揪出对应起止时间戳:就连“大笑”这种语义难理解型的,也能准确定位:方法名为自适应双分支促进网络(ADPN),由清华大学研究团队提出。0000