GitHub又火了一款AI工具 DUSt3R ：2张图2秒钟3D 重建

站长网2024-03-04 19:15:164阅

划重点:

⭐️ 一款名为 DUSt3R 的新工具火爆 GitHub，能在2秒钟内通过2张图片完成3D 重建。

⭐️ DUSt3R 在单目 / 多视图深度估计以及相对位姿估计任务上表现出色。

⭐️ 作者团队采用全新方法，无需相机校准或视点姿势先验信息，能在任意图像中完成3D 重建。

一款名为 DUSt3R 的 AI 工具近日在 GitHub 上备受瞩目，其能够在短短2秒钟内通过仅有2张图片完成3D 重建，让许多网友大呼惊奇，甚至认为这比之前热门的 Sora 更加实用。这一工具在单目 / 多视图深度估计以及相对位姿估计任务上表现出色，被认为是目前最先进的技术之一。

作者团队采用了一种全新的方法，称为 DUSt3R，它不需要任何相机校准或视点姿势的先验信息，就能完成任意图像的密集或无约束3D 重建。这意味着用户只需提供图片，无需额外的测量数据，便能轻松获得完整的3D 重建效果。DUSt3R 的网络架构基于标准 Transformer 编码器和解码器，受到 CroCo 的启发，并通过简单的回归损失训练完成。

在实验中，DUSt3R 在多项任务上取得了 SOTA 的成绩，包括绝对姿态估计、多视图姿态回归、单目深度估计和多视图深度估计。不仅如此，DUSt3R 还能够处理两张没有任何重叠内容的图像，仍然准确地完成3D 视图的重建，展现出其强大的功能和适用性。

该工具的出现引起了许多网友的兴趣，有人甚至在实验中测试了不同相机拍摄的图像，结果依然有效。DUSt3R 的出现为3D 重建任务提供了一种简单而高效的解决方案，让用户可以更轻松地完成相关工作。其优异的性能和快速的重建速度让人对其未来应用前景充满期待。

通过 DUSt3R 这一新工具的出现，用户可以更快速地实现3D 重建，无论是在室内还是室外场景，都能得到准确且完整的效果。这一技术的应用将极大地方便用户进行相关任务，带来更多可能性和创新。

论文https://arxiv.org/abs/2312.14132

项目入口：https://top.aibase.com/tool/dust3r

GitHub又火了一款AI工具DUSt3R2张图2秒钟3D重建

0004

评论列表

共(0)条

相关推荐

站长资讯
Plai Labs推文本到视频生成器PlaiDay 自拍照+文字即可生成个性化视频
要点:1.PlaiLabs推出了名为PlaiDay的文本到视频生成工具，允许用户通过上传自拍照片并输入一些文字来个性化生成短视频。2.PlaiLabs的AI平台Orchestra旨在为消费者提供协作和连接的AI工具，可以帮助设计师和产品经理创建AI功能。3.该AI平台不仅限于生成艺术，还可以应用于营销活动、安全监控、分析等各种领域。
站长网2023-11-08 10:59:26
0000
站长资讯
阿里云智能CTO周靖人：MaaS已成标准，未来应用都将围绕模型开发
阿里云智能集团CTO周靖人在2023中关村论坛人工智能大模型发展论坛上，发表了《MaaS，云智时代的AI新范式》的主题演讲。周靖人指出，“以模型为中心的开发范式（MaaS）已成为行业标准，未来应用开发的整个链路都会基于这一理念来做。”周靖人表示，Modelasaservice概念正在被广泛接受，模型会作为业务和开发系统开发的重要生产元素。
站长网2023-05-29 12:14:26
0000
站长资讯
70岁董明珠再提明年可能退休：鼓励经销商做好接力
站长之家（ChinaZ.com）8月23日消息:在郑州举行的河南格力2025年度营销峰会上，格力电器董事长兼总裁董明珠发表了演讲。会上，董明珠不仅分享了格力渠道变革的进展，还提到了自己可能在明年退休的计划。据董明珠介绍，格力的渠道变革已在全国各省基本完成，但仍需进一步梳理和完善，以实现最完美的服务体系。她强调，在大数据时代，传统销售方式已不再适用，格力正在打造线上与线下相结合的全新销售模式。
站长网2024-08-23 08:28:51
0000
站长资讯
没想到吧，原始部落野人都来直播带货了
直播带货真的包罗万象，没有你看不到的，只有你想不到的。有600万粉丝的探险博主这次把原始部落的“野人”带到了国内，整起了直播带货。一个原始人大哥（以下称小绿）脸上还涂了彩绘，另一个大哥(以下称猪牙哥)鼻孔里塞了两个野猪牙，还有一位大娘，除了衣服外，很有原始人感觉。这是在原始部落老家的大娘和猪牙哥。原始人当然不会中文了，看起来面对直播还略有拘谨。
站长网2024-09-25 13:11:36
0000
站长资讯
腾讯云智能小样本数智人生产平台发布支持多模态数据输入
昨日，腾讯云智能小样本数智人生产平台首次对外发布，平台具有训练样本小、生产效率高、自动化生产等特性。只需要3分钟真人口播视频、100句语音素材，平台便可通过音频、文本多模态数据输入，实时建模并生成高清人像，在24小时内制作出与真人近似的“数智人”。
站长网2023-04-26 08:54:44
0003