智源研究院开源10亿参数三维视觉通用模型Uni3D
站长网2023-10-20 10:21:350阅
智源研究院最近开源发布了一个10亿参数的三维视觉通用模型Uni3D。该模型是当前最大的三维视觉模型之一,能够处理点云数据,取得了主流三维视觉任务的全方位技术突破,展现出超强的通用视觉能力。
Uni3D的研发团队此前曾开发出最强的10亿参数二维视觉模型EVA。在开发Uni3D时,他们借鉴了二维视觉模型的设计经验,采用了统一的Transformer架构,并引入多模态对齐的训练方法,使用图像、文本数据来增强三维点云表示的学习。这使Uni3D可以直接继承二维视觉模型学习到的知识,迅速取得强大的三维视觉能力。
Uni3D在各类三维视觉任务上都取得了 state-of-the-art 的结果,包括零样本分类、少样本分割、文本驱动图像生成等。它展示了作为预训练模型的强大通用性和迁移学习能力。
智源研究院表示,Uni3D的开源发布为未来三维计算机视觉的研究和应用奠定了坚实的基础。
论文链接:
https://arxiv.org/abs/2310.06773
代码/模型链接:
https://github.com/baaivision/Uni3D
https://huggingface.co/BAAI/Uni3D/tree/main/modelzoo
0000
评论列表
共(0)条相关推荐
蔚来与吉利控股签署换电战略合作协议
2023年11月29日,浙江吉利控股集团有限公司与蔚来控股有限公司在杭州签署了换电战略合作协议,双方将在换电电池标准、换电技术、换电服务网络建设及运营、换电车型研发及定制、电池资产管理及运营等多个领域展开全面合作。站长网2023-11-29 14:01:430000“浪姐4”美依礼芽爆火出圈后:吸粉超430万,“抖快红”争相出手
“去年还是王心凌男孩,今年就是美依礼芽的二次元老肥宅。”近日,随着芒果TV《乘风2023》节目的火爆,谁是继王心凌后的第二个“涨粉奇迹”被大众广泛讨论。然而,可能就连芒果台自己也没想到,在汇集了谢娜、陈嘉桦Ella、蔡少芬等一众大咖阵容中,今年节目中人气断层的选手,居然会是来自日本的二次元歌手美依礼芽。站长网2023-05-22 11:57:230004中公教育:ChatGPT相关产品与服务的研究正在进行
近日,中公教育在接受调研时表示,公司高度重视ChatGPT的相关研究,尤其是在教育等相关垂直领域的应用,目前相关产品与服务的研究正在进行。中公公司强调,高度关注AI等前沿技术的发展和应用,并密切关注AI技术对教育的深远影响。为此,中公成立了人工智能与教育研究院,并结合业务开展情况积极布局,希望引领AI在职业教育和就业服务领域的技术应用和创新探索。站长网2023-05-15 09:31:210000一加Ace 3V发布 360周鸿祎:AI将让中国手机弯道超车
日前,一加手机盛大发布旗下新品——被誉为“年轻人的第一台AI手机”的一加Ace3V,吸引了业界和消费者的广泛关注。发布会上,一加特邀嘉宾、360集团创始人周鸿祎亲临现场,就AI手机的未来发展发表了独到见解。站长网2024-03-22 10:16:200001