智源研究院开源10亿参数三维视觉通用模型Uni3D
站长网2023-10-20 10:21:350阅
智源研究院最近开源发布了一个10亿参数的三维视觉通用模型Uni3D。该模型是当前最大的三维视觉模型之一,能够处理点云数据,取得了主流三维视觉任务的全方位技术突破,展现出超强的通用视觉能力。
Uni3D的研发团队此前曾开发出最强的10亿参数二维视觉模型EVA。在开发Uni3D时,他们借鉴了二维视觉模型的设计经验,采用了统一的Transformer架构,并引入多模态对齐的训练方法,使用图像、文本数据来增强三维点云表示的学习。这使Uni3D可以直接继承二维视觉模型学习到的知识,迅速取得强大的三维视觉能力。
Uni3D在各类三维视觉任务上都取得了 state-of-the-art 的结果,包括零样本分类、少样本分割、文本驱动图像生成等。它展示了作为预训练模型的强大通用性和迁移学习能力。
智源研究院表示,Uni3D的开源发布为未来三维计算机视觉的研究和应用奠定了坚实的基础。
论文链接:
https://arxiv.org/abs/2310.06773
代码/模型链接:
https://github.com/baaivision/Uni3D
https://huggingface.co/BAAI/Uni3D/tree/main/modelzoo
0000
评论列表
共(0)条相关推荐
Airbnb 部署 AI 驱动的防聚会系统阻止「高风险」万圣节派对预订
根据政策,Airbnb禁止任何具有干扰性或开放邀请性质的聚集。该平台还禁止对周围社区造成干扰,包括过多的噪音、访客和垃圾。但是在假日周末,这项政策并不能总是阻止不良行为的发生。在美国各地的万圣节庆祝活动即将到来之际,人工智能技术或许能发挥作用。该平台于日前宣布,它正在美国和加拿大部署一个由AI驱动的防聚会系统,以帮助减少假期周末期间干扰性和未授权聚会的风险。站长网2023-10-27 22:14:510000小米双11战报公布:全渠道支付金额破224亿元 创历年大促新纪录
快科技11月12日消息,据小米公司官微消息,小米公布了双11销售业绩。截至2023年11月11日23:59:59,小米双11全渠道支付金额破224亿元,创历年大促新纪录。值得注意的是,在这个双11期间,小米14获四大平台国产手机冠军,销量爆火。站长网2023-11-12 10:15:050000AMD、Intel业绩暴雷 NVIDIA成了全村的希望:AI关键一战
快科技5月3日消息,PC、数据中心市场的需求下滑已经让科技巨头面临巨大的业绩压力,Intel、AMD这几天都发布了财报,一个营收下滑36%,一个营收下滑9%,都是近年来罕见的情况。谁能在整个业界都不太好的情况下力挽狂澜?现在全村的希望都放在NVIDIA身上了,该公司预计在5月24日发布上季度财报。站长网2023-05-03 09:15:420000百度搜索居然还能P图:一键去除路人、一键抠图等
快科技4月29日消息,百度搜索的AI图片助手”新近推出了一项创新功能涂抹消除”。用户只需在百度APP中搜索修图”,上传所需图片,即可通过一键操作涂抹掉背景中不必要的元素,如过路行人或杂乱的背景等。今年5月,百度搜索还将上线一键抠图”和一键背景替换”等功能,更加方便用户修图。AI图片助手”不仅支持上传图片后的编辑,还允许在线编辑在百度搜索结果中找到的所有图片。站长网2024-04-30 07:41:010000理想汽车无人驾驶副驾驶坐着孩子 客服回应:坚决杜绝该操作
快科技5月6日消息,搭载了高阶智能驾驶辅助系统的车辆越来越多,作死的用户也屡见不鲜。近日有博主发布一段视频,一辆理想汽车驾驶员离开驾驶座,让汽车在无人驾驶”状态下自动行驶,副驾驶有一名儿童,且未系安全带,道路前方有其他车辆在行驶。为了诱骗车辆的验证系统,司机还把安全带插扣扣了上去,自己则在后排拍摄无人驾驶”视频。站长网2024-05-06 18:50:070001