OpenAI 发布新的文本生成 3D 模型 Shap-E:比 Point-E 更快更好
站长网2023-05-09 14:37:320阅
OpenAI 最近分享了他们在将文本提示转化为 3D 物体方面的最新探索,名为 Shap-E。这款生成式 AI 工具提供了一种新的方式来生成 3D 物体,其制作的物体比去年发布的 Point-E 模型更好、更详细、更准确。
截自Shap-E GitHub 页面
OpenAI 构建了 Shap-E 作为文本到 3D 模型生成器,能够生成细粒度纹理和复杂的详细形状。而 Point-E 根据文本提示生成 3D 点云,Shap-E 直接创建物体的轮廓,并采用了名为神经辐射场(NeRFs)的特性来克服之前模型的模糊性。NeRFs 是虚拟和增强现实中使用的技术,可以使三维场景看起来像是真实照片一样。
Shap-E 将这项技术应用于更常见的扩散模型,以形成与文本提示所建议的物体形状和纹理。该过程也比 Point-E 快得多。在单个 NVIDIA V100 GPU 上,集合中的每个 Shap-E 样本生成时间约为 13 秒,而 Point-E 在相同硬件上渲染可能需要多达两分钟的时间。
研究人员解释道:「我们发现,在相同的数据集、模型架构和训练计算资源的条件下,Shap·E 与类似的显式生成模型相匹配或超越其性能。我们还发现,我们的纯文本条件模型可以生成多样化、有趣的物体,而无需依赖图像作为中间表示。这些结果突显了生成隐式表示的潜力,特别是在像三维领域这样的领域,隐式表示比显式表示更具灵活性。」
Shap-E 的开发者承认,与 Point-E 的点云方法相比,大规模使用的计算能力可能较高。这款 AI 在理解如何制作一些复杂物体方面仍然存在困难,但总体而言,其结果在成功方面非常显著。
0000
评论列表
共(0)条相关推荐
阿里巴巴推出高保真图像到视频生成框架AtomoVideo
近日,阿里巴巴在人工智能领域再次取得突破,推出了一款名为AtomoVideo的高保真图像到视频生成框架。这一技术的问世,标志着基于文本到图像生成技术的视频生成领域取得了显著的快速发展。站长网2024-03-06 11:13:190000我在国庆靠“替人买单”赚钱,8天流水十几万
国庆假期结束,有人在这个假期追求诗和远方,有人抓紧闲暇搞钱。“不想出去看人山人海,有什么副业可以搞吗?”中秋国庆双节到来之前,爱搞钱的年轻人就提问了。站长网2023-10-08 17:17:580000淘宝88VIP升级无限次退货包邮权益 每单最高可抵扣25元运费
淘宝正在为尊贵的88VIP用户升级退货包运费权益,这一全新服务将提供无限次的退货包运费机会,每单最高可抵扣25元运费。目前,这项权益正处于灰度测试阶段,仅对部分用户开放,预计近期内将全面覆盖所有88VIP用户。站长网2024-04-19 15:51:100000Gemini Ultra将于2月7日上线 Gemini将推付费计划
GeminiUltra即将于2月7日上线,伴随着此次更新,Google聊天机器人Bard将更名为Gemini。这一消息源自一份泄露的文档,透露了GeminiUltra的上线日期以及一系列重要变化。站长网2024-02-05 12:03:140002NVIDIA发布GR00T基础模型 对Isaac机器人平台进行更新
划重点:⭐NVIDIA推出了GR00T项目,为人形机器人提供了通用基础模型,旨在推动机器人和具象化人工智能领域的突破。⭐Isaac机器人平台迎来重大更新,包括新的机器人训练模拟器、JetsonThor机器人计算机、生成式AI基础模型以及CUDA加速的感知和操作库。⭐GR00T将作为机器人的智能之躯,使其能够学习各种技能以解决各种任务。站长网2024-03-19 17:53:360001