GitHub又火了一款AI工具 DUSt3R :2张图2秒钟3D 重建
划重点:
⭐️ 一款名为 DUSt3R 的新工具火爆 GitHub,能在2秒钟内通过2张图片完成3D 重建。
⭐️ DUSt3R 在单目 / 多视图深度估计以及相对位姿估计任务上表现出色。
⭐️ 作者团队采用全新方法,无需相机校准或视点姿势先验信息,能在任意图像中完成3D 重建。
一款名为 DUSt3R 的 AI 工具近日在 GitHub 上备受瞩目,其能够在短短2秒钟内通过仅有2张图片完成3D 重建,让许多网友大呼惊奇,甚至认为这比之前热门的 Sora 更加实用。这一工具在单目 / 多视图深度估计以及相对位姿估计任务上表现出色,被认为是目前最先进的技术之一。

作者团队采用了一种全新的方法,称为 DUSt3R,它不需要任何相机校准或视点姿势的先验信息,就能完成任意图像的密集或无约束3D 重建。这意味着用户只需提供图片,无需额外的测量数据,便能轻松获得完整的3D 重建效果。DUSt3R 的网络架构基于标准 Transformer 编码器和解码器,受到 CroCo 的启发,并通过简单的回归损失训练完成。
在实验中,DUSt3R 在多项任务上取得了 SOTA 的成绩,包括绝对姿态估计、多视图姿态回归、单目深度估计和多视图深度估计。不仅如此,DUSt3R 还能够处理两张没有任何重叠内容的图像,仍然准确地完成3D 视图的重建,展现出其强大的功能和适用性。

该工具的出现引起了许多网友的兴趣,有人甚至在实验中测试了不同相机拍摄的图像,结果依然有效。DUSt3R 的出现为3D 重建任务提供了一种简单而高效的解决方案,让用户可以更轻松地完成相关工作。其优异的性能和快速的重建速度让人对其未来应用前景充满期待。
通过 DUSt3R 这一新工具的出现,用户可以更快速地实现3D 重建,无论是在室内还是室外场景,都能得到准确且完整的效果。这一技术的应用将极大地方便用户进行相关任务,带来更多可能性和创新。
论文https://arxiv.org/abs/2312.14132
项目入口:https://top.aibase.com/tool/dust3r
Plai Labs推文本到视频生成器PlaiDay 自拍照+文字即可生成个性化视频
要点:1.PlaiLabs推出了名为PlaiDay的文本到视频生成工具,允许用户通过上传自拍照片并输入一些文字来个性化生成短视频。2.PlaiLabs的AI平台Orchestra旨在为消费者提供协作和连接的AI工具,可以帮助设计师和产品经理创建AI功能。3.该AI平台不仅限于生成艺术,还可以应用于营销活动、安全监控、分析等各种领域。站长网2023-11-08 10:59:260000阿里云智能CTO周靖人:MaaS已成标准,未来应用都将围绕模型开发
阿里云智能集团CTO周靖人在2023中关村论坛人工智能大模型发展论坛上,发表了《MaaS,云智时代的AI新范式》的主题演讲。周靖人指出,“以模型为中心的开发范式(MaaS)已成为行业标准,未来应用开发的整个链路都会基于这一理念来做。”周靖人表示,Modelasaservice概念正在被广泛接受,模型会作为业务和开发系统开发的重要生产元素。站长网2023-05-29 12:14:26000070岁董明珠再提明年可能退休:鼓励经销商做好接力
站长之家(ChinaZ.com)8月23日消息:在郑州举行的河南格力2025年度营销峰会上,格力电器董事长兼总裁董明珠发表了演讲。会上,董明珠不仅分享了格力渠道变革的进展,还提到了自己可能在明年退休的计划。据董明珠介绍,格力的渠道变革已在全国各省基本完成,但仍需进一步梳理和完善,以实现最完美的服务体系。她强调,在大数据时代,传统销售方式已不再适用,格力正在打造线上与线下相结合的全新销售模式。站长网2024-08-23 08:28:510000没想到吧,原始部落野人都来直播带货了
直播带货真的包罗万象,没有你看不到的,只有你想不到的。有600万粉丝的探险博主这次把原始部落的“野人”带到了国内,整起了直播带货。一个原始人大哥(以下称小绿)脸上还涂了彩绘,另一个大哥(以下称猪牙哥)鼻孔里塞了两个野猪牙,还有一位大娘,除了衣服外,很有原始人感觉。这是在原始部落老家的大娘和猪牙哥。原始人当然不会中文了,看起来面对直播还略有拘谨。站长网2024-09-25 13:11:360000腾讯云智能小样本数智人生产平台发布 支持多模态数据输入
昨日,腾讯云智能小样本数智人生产平台首次对外发布,平台具有训练样本小、生产效率高、自动化生产等特性。只需要3分钟真人口播视频、100句语音素材,平台便可通过音频、文本多模态数据输入,实时建模并生成高清人像,在24小时内制作出与真人近似的“数智人”。站长网2023-04-26 08:54:440003