智源研究院开源10亿参数三维视觉通用模型Uni3D
站长网2023-10-20 10:21:350阅
智源研究院最近开源发布了一个10亿参数的三维视觉通用模型Uni3D。该模型是当前最大的三维视觉模型之一,能够处理点云数据,取得了主流三维视觉任务的全方位技术突破,展现出超强的通用视觉能力。
Uni3D的研发团队此前曾开发出最强的10亿参数二维视觉模型EVA。在开发Uni3D时,他们借鉴了二维视觉模型的设计经验,采用了统一的Transformer架构,并引入多模态对齐的训练方法,使用图像、文本数据来增强三维点云表示的学习。这使Uni3D可以直接继承二维视觉模型学习到的知识,迅速取得强大的三维视觉能力。
Uni3D在各类三维视觉任务上都取得了 state-of-the-art 的结果,包括零样本分类、少样本分割、文本驱动图像生成等。它展示了作为预训练模型的强大通用性和迁移学习能力。
智源研究院表示,Uni3D的开源发布为未来三维计算机视觉的研究和应用奠定了坚实的基础。

论文链接:
https://arxiv.org/abs/2310.06773
代码/模型链接:
https://github.com/baaivision/Uni3D
https://huggingface.co/BAAI/Uni3D/tree/main/modelzoo
0000
评论列表
共(0)条相关推荐
测试发现,ChatGPT选股表现优于标准普尔500指数股票投资组合
ChatGPT会成为你的下一个基金经理吗?金融比较网站Finder.com发现,在八周的时间里,ChatGPT挑选的一个虚拟股票组合的表现优于标准普尔500指数——美国500家最有价值公司的名单。该投资组合在3月6日至4月28日期间上涨了4.9%,而同期英国十大领先投资基金的平均亏损为0.8%。相比之下,标准普尔500指数仅上涨了3%。站长网2023-05-09 10:47:440000OpenAI 发布 ChatGPT 官方 App 大更新:支持 iPad、Siri 和快捷指令
OpenAI发布的ChatGPT官方iOS应用程序迎来了重大更新。该应用程序已经在上个月登陆了美国、英国、法国、德国和韩国等AppStore,并且成为该市场上最受欢迎的免费应用程序。站长网2023-06-09 19:25:540002苹果首款混合现实头显今年出货量预计「不足 10 万台」
研究公司TrendForce报告称,苹果的混合现实头戴设备主要面向开发者,并且今年的出货量可能低于10万台。TrendForce称,这款头戴设备的高成本、制造难度以及重点对开发者的关注将「主要限制今年的销售在预订阶段」。尽管苹果的头戴设备可能会刺激AR/VR产品类别的一些新需求,但设备价格高昂,据估计约为3000美元左右,这显然会对更广泛的市场增长构成重大障碍。站长网2023-05-25 11:04:430000联想将推出多款搭载 AMD AI 引擎的计算机:改变 PC 体验
AMD在今年推出了锐龙PRO7040系列处理器,这是业界首款具有专用AI引擎的x86处理器。根据AMD的预测,AMD锐龙AI技术将为客户在新一代协作、创造力和生产力、预测性界面以及采用AI技术的安全功能等方面带来卓越的体验优势。站长网2023-08-04 10:31:190000