Tracking Any Object Amodally :让AI像人一样可以追踪任何对象
Tracking Any Object Amodally是由卡内基梅隆大学和丰田研究所开发的项目使得人工智能能够像人一样追踪物体的整体,即使在部分遮挡或不完全可见的情况下也能理解其完整结构。
在这个项目中,计算机被训练成能够“理解”并追踪到部分遮挡物体的完整形状和位置。这对于自动驾驶车辆来说尤为重要,因为它能让车辆在复杂的环境中更安全、更可靠地识别和追踪部分被遮挡的行人或其他车辆。

项目地址:https://tao-amodal.github.io/
代码:https://github.com/WesleyHsieh0806/TAO-Amodal
为了提高物体追踪技术,他们专门设计了一个数据集:TAO-Amodal。这个数据集包含大量的视频序列,其中包括各种被遮挡或部分可见的物体,以及详细标注信息,让AI能够更好地理解和追踪那些我们只能看到一部分的物体。
TAO-Amodal数据集包含了880种多样的类别,覆盖数千个视频序列。数据集包括完全不可见、部分出框和被遮挡物体的 amodal(非模态)和 modal(模态)边界框。该数据集的重点在于评估当前追踪器在遮挡推理方面的能力,通过追踪任何物体(Tracking Any Object)的 Amodal 感知(Amodal perception)来实现。
此外,项目还开发了一个轻量级插件模块“Amodal Expander 插件”,用于改进物体追踪器的功能。这个插件能够将标准的 Modal 追踪器转换为 Amodal 追踪器,从而在追踪部分遮挡或不完全可见的物体时更为有效和准确。
在TAO-Amodal数据集上的测试结果显示,该技术在检测和追踪被遮挡物体方面取得了3.3%和1.6%的改进。特别是在追踪人物方面,与现有的模态追踪技术相比,性能提高了2倍。这个项目的成功将大幅提升计算机视觉系统的智能,让它们在处理遮挡物体时更加像人类,从而在自动驾驶、视频监控等领域发挥更大的作用。
AI重新定义汽车,“蔚小理”抢先交卷
近日,智能驾驶行业的军备竞赛似乎开始全面提速。小鹏汽车正式向全球用户发布AI天玑系统XOS5.2.0版本,这是全球唯二实现端到端大模型量产落地的车企。抓紧时间交卷的还有理想和蔚来,理想首次公开了其端到端自动驾驶技术架构;蔚来智能驾驶技术架构NADArch2.0也正式对外发布,并在算法层升级为引入了端到端架构。站长网2024-08-05 13:52:200000餐饮生存战:平价消费时代,别盲目卷低价
最近「定焦One」发布了一篇文章《“3元管饱”,平价快餐店卷起来了》,引发很多消费者和餐饮人共鸣,多位消费者留言分享自己的“省钱妙招”和“私藏宝店”,餐饮人则表示也注意到行业已经进入平价时代,准备主动出击,抓住这一波消费趋势。针对这些反馈,「定焦One」再次和多位餐饮从业者进行了深入交流,希望更加全面的呈现当前的餐饮现状,以及平价时代存在的转型机会,给更多餐饮人参考和借鉴。0000雷军:预计小米未来5年研发投入超1000亿
快科技10月26日消息,在今晚小米14系列发布会上,小米CEO雷军表示,小米未来5年研发投入预计超过1000亿元。根据国家统计局等部门发布的《2022年全国科技经费投入统计公报》显示,全国研发经费投入30782.9亿,其中,小米研发投入162亿元。雷军表示,2022年小米研发投入在全国研发投入中占比0.53%。站长网2023-10-26 20:53:020000Meta 发布多语言语音翻译模型 SeamlessM4T:可翻译多达 100 种语言、语音或文本
周二,Meta宣布推出SeamlessM4T,一种用于语音和文本翻译的多模态人工智能模型。作为一种能够处理文本和音频的神经网络,它可以执行文本到语音、语音到文本、语音到语音和文本到文本的翻译,支持「最多100种语言」,Meta表示,它的目标是帮助说不同语言的人更有效地交流。图片来自Meta站长网2023-08-23 16:26:550000五菱宏光MINI EV家族至高直降13000元 全系29800元起
今日,五菱汽车宣布,即日起,五菱宏光MINIEV家族至高直降13000元,新老用户选购均可享受优惠,全系29800元起。据了解,近日,国家发展改革委、国家能源局发布《关于加快推进充电基础设施建设更好支持新能源汽车下乡和乡村振兴的实施意见》,鼓励新能源汽车企业支持农村地区购买使用新能源汽车。站长网2023-05-22 10:33:590000