T-Rex2:文字来描述、框选就能识别图片中的目标物体
>
划重点:
⭐ T-Rex2是一种通用目标检测技术,通过视觉和文本提示协同作用,实现对各种对象的识别。没有开源,有API可以使用。
⭐ T-Rex2整合了图像编码器、视觉提示编码器、文本提示编码器和框解码器,实现了最先进的性能。
⭐ T-Rex2除了通过文字来描述要检测的物体,还支持直接在图里框出一个样例,系统自动识别出剩余的目标。
DeepDataSpace 推出了 T-Rex2,一种革新性的目标检测技术,旨在解决传统目标检测模型的封闭集问题。传统模型局限于事先确定的类别集,需要针对特定任务进行调整和大量训练数据。相比之下,T-Rex2不仅能够识别日常物体,还能识别更为奇特的物体,无需特定任务的调整或大量训练数据。该模型通过结合文本和视觉提示的优势,实现了对各种场景中的物体的理解和检测。

T-Rex2整合了图像编码器、视觉提示编码器、文本提示编码器和框解码器四个组件,遵循 DETR 的设计原则,实现了端到端的目标检测模型。
在四个学术基准测试中,包括 COCO、LVIS、ODinW 和 Roboflow100,T-Rex2在零样本设置下实现了最先进的性能。除了学术领域,T-Rex2还适用于各种实际应用场景,包括农业、工业、生物学、医学、零售、物流等领域。其灵活性和适应性使其成为研究人员、开发者和组织的宝贵工具,推动物体检测技术的发展。

作为一种通用目标检测技术,T-Rex2还可用于开放集视频目标检测和视频目标跟踪,,为视频处理领域带来了新的可能性。结合 ByteTrack 算法,T-Rex2可以准确跟踪视频中的任何对象。
未来,DeepDataSpace 将开放 T-Rex2的免费 API 访问,为教育工作者、学生和研究人员提供支持。通过 Demo 和 API,用户可以体验 T-Rex2的能力,并探索其在各领域的潜在应用。
产品入口:https://top.aibase.com/tool/t-rex2
试玩地址:https://deepdataspace.com/playground/ivp
10天吸粉1142万!郭有才仅凭一首《诺言》就火遍全国,凭啥?
最近,抖音新出了个现象级网红@”郭有才“,他靠一首《诺言》10天涨粉1142.6万,还带火了山东菏泽这座城市。每天至少有40万人涌入菏泽,只为现场听郭有才唱歌。这位新晋的现象级网红,到底什么来头?其实,郭有才早在2017年就开始拍短视频了。当时他选择在农村拍土味搞笑题材,想靠外八字走路的脚步来吸引粉丝,但反响一般。随后郭有才更换账号,选择直播唱歌。站长网2024-05-22 22:22:420001IBM在印度甘地讷格尔开设新的客户创新中心 聚焦生成式AI
划重点:1.🚀IBM宣布在印度甘地讷格尔开设新的IBM咨询客户创新中心,标志着该公司在印度非大都市和新兴城市的持续扩张。2.💡该中心将聚焦生成式AI、混合云和网络安全等关键技术领域,加速数字转型并促进该地区的经济增长。3.👥甘地讷格尔的扩展将为现有员工提供机会,同时帮助IBM吸纳该地教育生态系统中的潜在人才,包括毕业生。站长网2023-11-24 16:50:280000Meta发布全新Megabyte模型 比Transformer快4成
最近,Meta团队开发了一款名为Megabyte的模型,声称能够解决“大模型标配”Transformer所存在的问题,而且速度比它还快4成!站长网2023-05-30 14:55:390000ChatGPT一周年,差点吓死OpenAI
加缪说:真正严肃的哲学问题只有一个,那就是自杀。OpenAI刚刚平息的“政变”,其实就是对“自杀”的一次深入思考。ChatGPT上线满一周年之际,回归OpenAI的阿尔特曼,重新出任CEO。回到原职位的阿尔特曼,也在迎接公司内外部对AI威胁论的新一波审视。站长网2023-11-30 18:15:010000Post-Training有多重要?AI2研究员长文详解前沿模型的后训练秘籍
越来越多研究发现,后训练对模型性能同样重要。AllenAI的机器学习研究员NathanLambert最近发表了一篇技术博文,总结了科技巨头们所使用的模型后训练配方。随着LLM学界和工业界日新月异的发展,不仅预训练所用的算力和数据正在疯狂内卷,后训练(post-training)的对齐和微调方法也在不断更新。站长网2024-08-20 09:13:450000