首页站长资讯新加坡南洋理工大学出品！大规模视频分割数据集MeViS，自动识别视频动态主体

新加坡南洋理工大学出品！大规模视频分割数据集MeViS，自动识别视频动态主体

站长网2023-08-26 16:14:340阅

文章概要:

1） MeVIS数据集包含2006段视频，强调目标物体的运动属性，不能仅从单帧识别。

2）提出LMPM基准方法，利用语言理解和运动评估找到视频中语言描述的目标物体。

3）研究为发展更高级的语言引导视频分割算法奠定基础。

当前用于引用视频对象的数据集通常强调突出的对象并依赖于具有许多静态属性的语言表达。这些属性允许仅在单帧中识别目标对象。然而，这些数据集忽视了运动在语言引导视频对象分割中的重要性。

新加坡南洋理工大学研究人员发表了一篇AI论文，提出了一个大规模视频分割基准数据集MeVIS（Motion Expression Video Segmentation）。简单的说，MeViS是一个大规模的视频分割数据集，它让计算机能够根据描述对象运动的自然语言语句来分割和跟踪视频中的目标对象。

MeViS 数据集包含2，006个视频和8，171个对象，并提供了28，570个运动表达式来引用这些对象。数据集示例中，表达主要集中在运动属性，被指代的目标物体无法仅通过观察单帧进行识别。上图显示了 MeViS 中的表达式主要关注运动属性，仅通过检查单帧无法识别所涉及的目标对象。比如给计算机一个视频和一个句子“飞离树枝的鸟”，它就可以在整个视频中找出符合这个句子描述的鸟，并把这只鸟在每一帧图像中的位置分割出来。

MeViS不同于以前的数据集，以前的数据集更关注静态的特征比如颜色、形状等来分割，而MeViS关注的是运动信息。例如视频里有三只外观很像的鸟，只有根据它们的飞行动作才能区分出目标鸟。

研究人员采取了一些步骤，确保MeVIS数据集强调视频的时间运动:

首先，仔细选择视频内容，其中包含与运动共存的多个对象，并排除具有静态属性可以轻松描述的孤立对象的视频。

其次，在仅通过动作词就可以明确描述目标对象的情况下，优先考虑不包含静态线索（例如类别名称或对象颜色）的语言表达。

除了提出MeVIS数据集，研究人员还给出了一个基准方法LMPM（Language-guided Motion Perception and Matching）来解决这个数据集提出的挑战。他们的方法包含生成语言条件查询来在视频中识别可能的目标物体，使用更稳健高效的对象嵌入来表示这些对象，应用运动感知捕捉对象嵌入的时间上下文，从而建立视频运动动力学的整体理解，以掌握视频中的瞬时运动和持续运动。

然后，他们比较语言特征与预测的对象运动，找到语言表达中提到的目标物体。这种方法有效结合了语言理解和运动评估来处理复杂的数据集任务。

这项研究为开发更高级的语言引导视频分割算法奠定了基础。它向更具挑战性的方向开辟了道路，如探索更好的理解运动和建模技术、创建更高效的模型以减少冗余检测物体、设计有效的跨模态融合方法等。解决这些挑战需要推动语言引导视频分割领域的当前最新技术。

项目网址:

https://github.com/henghuiding/MeViS

https://henghuiding.github.io/MeViS/

论文:https://arxiv.org/abs/2308.08544

新加坡南洋理工大学出品大规模视频分割数据集MeViS自动识别视频动态主体

0000

评论列表

共(0)条

相关推荐

站长资讯
OpenAI CEO：美国正在对加密货币发动「战争」并希望「控制」比特币
比特币和加密货币今年在美国政府打压下陷入困境，而这种情况可能会进一步恶化。比特币价格在2023年上半年大幅上涨后失去了动力。现在，ChatGPT开发者OpenAI的CEO和人工智能（AI）先驱SamAltman警告说，美国政府正在对加密货币发动「战争」，并希望「控制」比特币。
站长网2023-10-08 10:59:12
0001
站长资讯
华为：上半年销售收入4175亿元同比增长 34.3%
今日，华为发布2024年上半年经营业绩。上半年，华为实现销售收入4175亿人民币，同比增长34.3%，净利润率13.2%，整体经营稳健，结果符合预期。华为轮值董事长徐直军表示:“集团整体经营情况符合预期。我们将贯彻全流程'高质量”的公司战略，持续优化产业组合，增强发展韧性，建设繁荣产业生态，为客户贡献更有竞争力的产品和解决方案。
站长网2024-08-31 16:11:19
0000
站长资讯
达播、店播双爆发，淘宝开始两条腿走路
这届天猫双11，淘宝达播、店播双双爆发。官方数据显示，今年双11正式启动首日，淘宝就有29个直播间成交额破亿，280个店铺直播间成交额破千万。主播方面，截至11月3日，胡可直播间在大规模体量的基础上，成交相比去年增长100%;东方甄选、酒仙亮哥、阿卓酒馆等入淘不到一年的新直播间，预售4小时即破亿，两位酒水主播也创下了他们的全网单日直播带货最高纪录。
站长网2023-11-08 20:42:05
0000
站长资讯
现在招聘的AI产品经理，主要要会什么？
现在在招聘产品经理，你可以看到已经有企业在招聘AI方面的产品经理了，可以看到AI产品经理主要集中在为企业提供工具类产品。▲AI产品经理招聘需求现在应聘一个AI产品经理，要求是什么呢?相比普通的产品经理区别是什么?我在这段时间建立的AI产品经理社群进行了讨论，得到了以下几个结论，分享给读者朋友。1.AI产品经理首先要学会选择AI厂家
站长网2023-10-18 21:26:36
0000
站长资讯
抖音全资入股涉AI软件开发业务科技公司
天眼查App显示，近日，武汉安杰旺达科技有限公司发生工商变更，原股东、法定代表人、主要人员均退出，新增抖音集团旗下北京笔墨留香科技有限公司为股东并全资持股。据介绍，该公司经营范围含网络与信息安全软件开发、人工智能应用软件开发、数据处理和存储支持服务、互联网销售、云计算装备技术服等。
站长网2023-08-04 11:51:57
0000