登陆注册

文字来描述

  • T-Rex2:文字来描述、框选就能识别图片中的目标物体

    >划重点:⭐T-Rex2是一种通用目标检测技术,通过视觉和文本提示协同作用,实现对各种对象的识别。没有开源,有API可以使用。⭐T-Rex2整合了图像编码器、视觉提示编码器、文本提示编码器和框解码器,实现了最先进的性能。⭐T-Rex2除了通过文字来描述要检测的物体,还支持直接在图里框出一个样例,系统自动识别出剩余的目标。
    站长网2024-03-26 17:15:45
    0002