20345

T-Rex2：文字来描述、框选就能识别图片中的目标物体

站长网2024-03-26 17:15:452阅

划重点:

⭐ T-Rex2是一种通用目标检测技术，通过视觉和文本提示协同作用，实现对各种对象的识别。没有开源，有API可以使用。

⭐ T-Rex2整合了图像编码器、视觉提示编码器、文本提示编码器和框解码器，实现了最先进的性能。

⭐ T-Rex2除了通过文字来描述要检测的物体，还支持直接在图里框出一个样例，系统自动识别出剩余的目标。

DeepDataSpace 推出了 T-Rex2，一种革新性的目标检测技术，旨在解决传统目标检测模型的封闭集问题。传统模型局限于事先确定的类别集，需要针对特定任务进行调整和大量训练数据。相比之下，T-Rex2不仅能够识别日常物体，还能识别更为奇特的物体，无需特定任务的调整或大量训练数据。该模型通过结合文本和视觉提示的优势，实现了对各种场景中的物体的理解和检测。

T-Rex2整合了图像编码器、视觉提示编码器、文本提示编码器和框解码器四个组件，遵循 DETR 的设计原则，实现了端到端的目标检测模型。

在四个学术基准测试中，包括 COCO、LVIS、ODinW 和 Roboflow100，T-Rex2在零样本设置下实现了最先进的性能。除了学术领域，T-Rex2还适用于各种实际应用场景，包括农业、工业、生物学、医学、零售、物流等领域。其灵活性和适应性使其成为研究人员、开发者和组织的宝贵工具，推动物体检测技术的发展。

作为一种通用目标检测技术，T-Rex2还可用于开放集视频目标检测和视频目标跟踪，，为视频处理领域带来了新的可能性。结合 ByteTrack 算法，T-Rex2可以准确跟踪视频中的任何对象。

未来，DeepDataSpace 将开放 T-Rex2的免费 API 访问，为教育工作者、学生和研究人员提供支持。通过 Demo 和 API，用户可以体验 T-Rex2的能力，并探索其在各领域的潜在应用。

产品入口：https://top.aibase.com/tool/t-rex2

试玩地址：https://deepdataspace.com/playground/ivp

T Rex2文字来描述框选就能识别图片中的目标物体

0002

评论列表

共(0)条

相关推荐

站长资讯
10天吸粉1142万！郭有才仅凭一首《诺言》就火遍全国，凭啥？
最近，抖音新出了个现象级网红@”郭有才“，他靠一首《诺言》10天涨粉1142.6万，还带火了山东菏泽这座城市。每天至少有40万人涌入菏泽，只为现场听郭有才唱歌。这位新晋的现象级网红，到底什么来头?其实，郭有才早在2017年就开始拍短视频了。当时他选择在农村拍土味搞笑题材，想靠外八字走路的脚步来吸引粉丝，但反响一般。随后郭有才更换账号，选择直播唱歌。
站长网2024-05-22 22:22:42
0001
站长资讯
IBM在印度甘地讷格尔开设新的客户创新中心聚焦生成式AI
划重点:1.🚀IBM宣布在印度甘地讷格尔开设新的IBM咨询客户创新中心，标志着该公司在印度非大都市和新兴城市的持续扩张。2.💡该中心将聚焦生成式AI、混合云和网络安全等关键技术领域，加速数字转型并促进该地区的经济增长。3.👥甘地讷格尔的扩展将为现有员工提供机会，同时帮助IBM吸纳该地教育生态系统中的潜在人才，包括毕业生。
站长网2023-11-24 16:50:28
0000
站长资讯
Meta发布全新Megabyte模型比Transformer快4成
最近，Meta团队开发了一款名为Megabyte的模型，声称能够解决“大模型标配”Transformer所存在的问题，而且速度比它还快4成!
站长网2023-05-30 14:55:39
0000
站长资讯
ChatGPT一周年，差点吓死OpenAI
加缪说:真正严肃的哲学问题只有一个，那就是自杀。OpenAI刚刚平息的“政变”，其实就是对“自杀”的一次深入思考。ChatGPT上线满一周年之际，回归OpenAI的阿尔特曼，重新出任CEO。回到原职位的阿尔特曼，也在迎接公司内外部对AI威胁论的新一波审视。
站长网2023-11-30 18:15:01
0000
站长资讯
Post-Training有多重要？AI2研究员长文详解前沿模型的后训练秘籍
越来越多研究发现，后训练对模型性能同样重要。AllenAI的机器学习研究员NathanLambert最近发表了一篇技术博文，总结了科技巨头们所使用的模型后训练配方。随着LLM学界和工业界日新月异的发展，不仅预训练所用的算力和数据正在疯狂内卷，后训练（post-training）的对齐和微调方法也在不断更新。
站长网2024-08-20 09:13:45
0000