T-Rex2:文字来描述、框选就能识别图片中的目标物体
>
划重点:
⭐ T-Rex2是一种通用目标检测技术,通过视觉和文本提示协同作用,实现对各种对象的识别。没有开源,有API可以使用。
⭐ T-Rex2整合了图像编码器、视觉提示编码器、文本提示编码器和框解码器,实现了最先进的性能。
⭐ T-Rex2除了通过文字来描述要检测的物体,还支持直接在图里框出一个样例,系统自动识别出剩余的目标。
DeepDataSpace 推出了 T-Rex2,一种革新性的目标检测技术,旨在解决传统目标检测模型的封闭集问题。传统模型局限于事先确定的类别集,需要针对特定任务进行调整和大量训练数据。相比之下,T-Rex2不仅能够识别日常物体,还能识别更为奇特的物体,无需特定任务的调整或大量训练数据。该模型通过结合文本和视觉提示的优势,实现了对各种场景中的物体的理解和检测。
T-Rex2整合了图像编码器、视觉提示编码器、文本提示编码器和框解码器四个组件,遵循 DETR 的设计原则,实现了端到端的目标检测模型。
在四个学术基准测试中,包括 COCO、LVIS、ODinW 和 Roboflow100,T-Rex2在零样本设置下实现了最先进的性能。除了学术领域,T-Rex2还适用于各种实际应用场景,包括农业、工业、生物学、医学、零售、物流等领域。其灵活性和适应性使其成为研究人员、开发者和组织的宝贵工具,推动物体检测技术的发展。
作为一种通用目标检测技术,T-Rex2还可用于开放集视频目标检测和视频目标跟踪,,为视频处理领域带来了新的可能性。结合 ByteTrack 算法,T-Rex2可以准确跟踪视频中的任何对象。
未来,DeepDataSpace 将开放 T-Rex2的免费 API 访问,为教育工作者、学生和研究人员提供支持。通过 Demo 和 API,用户可以体验 T-Rex2的能力,并探索其在各领域的潜在应用。
产品入口:https://top.aibase.com/tool/t-rex2
试玩地址:https://deepdataspace.com/playground/ivp
让虚拟角色动作更真实!科研团队利用机器学习技术提升运动模拟技术
本文概要:1.研究团队利用机器学习系统从广播视频中学习网球技能,实现了真实的动作模拟。2.他们使用物理模拟和动作规划策略来指导角色的运动,并能够生成稳定的控制器。3.这项技术有望扩展到其他运动领域,并为机器人学习提供方法。站长网2023-08-07 15:51:490000网信办:整治利用生成式AI制作发布涉未成年人有害信息行为
中央网信办发布《关于开展“清朗·2023年暑期未成年人网络环境整治”专项行动的通知》称,即日起,开展为期2个月的“清朗·2023年暑期未成年人网络环境整治”专项行动。站长网2023-06-29 04:07:100000天涯想靠“天涯神贴”翻身,可时代不会再给机会了
不同于猫扑和西祠胡同,已经走向没落的天涯似乎并不甘于就此退出互联网这个舞台。日前,就在因拖欠服务器费用而被关闭、“七天七夜重启天涯”的直播义卖活动并未取得成功后,天涯社区创始人、董事长邢明在接受采访时透露了天涯的“自救计划”。明年3月1日、也就是天涯社区25年司庆时,其将正式重启。010000腾讯觅影发布“数智医疗影像平台” 搭载AI分析能力
近日,腾讯觅影正式推出“腾讯觅影数智医疗影像平台”,通过数字化及智能化升级,深耕医疗影像“产学研管”全链条创新,实现医疗影像AI的多场景、规模化应用以及可持续发展。站长网2023-06-05 21:07:020000苹果推出全新 15 英寸 MacBook Air:搭载 M2 芯片 售价 10499 元起
苹果在WWDC2023上宣布推出了一款全新的MacBookAir,配备了15.3英寸LiquidRetina显示屏,并搭载了苹果最新的M2芯片。站长网2023-06-06 16:24:460000