T-Rex2:文字来描述、框选就能识别图片中的目标物体
>
划重点:
⭐ T-Rex2是一种通用目标检测技术,通过视觉和文本提示协同作用,实现对各种对象的识别。没有开源,有API可以使用。
⭐ T-Rex2整合了图像编码器、视觉提示编码器、文本提示编码器和框解码器,实现了最先进的性能。
⭐ T-Rex2除了通过文字来描述要检测的物体,还支持直接在图里框出一个样例,系统自动识别出剩余的目标。
DeepDataSpace 推出了 T-Rex2,一种革新性的目标检测技术,旨在解决传统目标检测模型的封闭集问题。传统模型局限于事先确定的类别集,需要针对特定任务进行调整和大量训练数据。相比之下,T-Rex2不仅能够识别日常物体,还能识别更为奇特的物体,无需特定任务的调整或大量训练数据。该模型通过结合文本和视觉提示的优势,实现了对各种场景中的物体的理解和检测。
T-Rex2整合了图像编码器、视觉提示编码器、文本提示编码器和框解码器四个组件,遵循 DETR 的设计原则,实现了端到端的目标检测模型。
在四个学术基准测试中,包括 COCO、LVIS、ODinW 和 Roboflow100,T-Rex2在零样本设置下实现了最先进的性能。除了学术领域,T-Rex2还适用于各种实际应用场景,包括农业、工业、生物学、医学、零售、物流等领域。其灵活性和适应性使其成为研究人员、开发者和组织的宝贵工具,推动物体检测技术的发展。
作为一种通用目标检测技术,T-Rex2还可用于开放集视频目标检测和视频目标跟踪,,为视频处理领域带来了新的可能性。结合 ByteTrack 算法,T-Rex2可以准确跟踪视频中的任何对象。
未来,DeepDataSpace 将开放 T-Rex2的免费 API 访问,为教育工作者、学生和研究人员提供支持。通过 Demo 和 API,用户可以体验 T-Rex2的能力,并探索其在各领域的潜在应用。
产品入口:https://top.aibase.com/tool/t-rex2
试玩地址:https://deepdataspace.com/playground/ivp
OpenAI与《大西洋月刊》和The Verge发行商Vox Media达成合作
划重点:⭐️OpenAI与TheAtlantic和VoxMedia分别达成合作,许可其内容用于训练大型语言模型。⭐️合作协议涉及许可费用和访问OpenAI技术,以及对内容和数据的使用。⭐️VoxMedia总裁PamWasserstein就合作发表了看法,强调AI技术对媒体业的重要性和保护知识产权。站长网2024-05-30 21:23:410000芯片设计公司Arm计划9月IPO 苹果、三星、英伟达等将进行投资
软银集团旗下的英国芯片设计公司Arm计划于9月在纳斯达克上市。该公司预计估值将超过600亿美元,成为今年迄今为止全球规模最大的IPO。软银将于本月晚些时候向美国证券交易委员会提交上市申请,并且必须获得纳斯达克的批准才能进行首次公开募股。站长网2023-08-09 11:15:140000快手本地生活上线首个服务品牌“信任购”
快手本地生活推出了首个服务品牌"信任购",旨在提供更可靠的购物体验。该品牌包括五大服务权益,分别是"随时可退"、"过期自动退"、"极速退款"、"免预约"和"周末节假日通用"。站长网2023-07-12 07:08:150000拖拽P图技术又升级了:StableDrag更稳、更准,南大、腾讯联合打造
去年5月,动动鼠标就能让图片变「活」得研究DragGAN吸引了AI圈的关注。通过拖拽,我们可以改变并合成自己想要的图像,比如下图中让一头狮子转头并张嘴。实现这一效果的研究出自华人一作领衔的「DragYourGAN」论文,于上个月放出并已被SIGGRAPH2023会议接收。相关的项目在GitHub上已经积累了34.5k的Star量。站长网2024-03-19 03:09:060000苹果完成收购加拿大公司 DarwinAI iOS18将有重大更新
据报道,苹果公司最近完成了对位于加拿大的DarwinAI公司的收购,以加强其人工智能团队。DarwinAI专注于开发人工智能技术,用于检查制造过程中的零部件,并致力于打造更高效的人工智能系统。站长网2024-03-15 09:48:100000