OpenAI 发布新的文本生成 3D 模型 Shap-E:比 Point-E 更快更好
站长网2023-05-09 14:37:320阅
OpenAI 最近分享了他们在将文本提示转化为 3D 物体方面的最新探索,名为 Shap-E。这款生成式 AI 工具提供了一种新的方式来生成 3D 物体,其制作的物体比去年发布的 Point-E 模型更好、更详细、更准确。
截自Shap-E GitHub 页面
OpenAI 构建了 Shap-E 作为文本到 3D 模型生成器,能够生成细粒度纹理和复杂的详细形状。而 Point-E 根据文本提示生成 3D 点云,Shap-E 直接创建物体的轮廓,并采用了名为神经辐射场(NeRFs)的特性来克服之前模型的模糊性。NeRFs 是虚拟和增强现实中使用的技术,可以使三维场景看起来像是真实照片一样。
Shap-E 将这项技术应用于更常见的扩散模型,以形成与文本提示所建议的物体形状和纹理。该过程也比 Point-E 快得多。在单个 NVIDIA V100 GPU 上,集合中的每个 Shap-E 样本生成时间约为 13 秒,而 Point-E 在相同硬件上渲染可能需要多达两分钟的时间。
研究人员解释道:「我们发现,在相同的数据集、模型架构和训练计算资源的条件下,Shap·E 与类似的显式生成模型相匹配或超越其性能。我们还发现,我们的纯文本条件模型可以生成多样化、有趣的物体,而无需依赖图像作为中间表示。这些结果突显了生成隐式表示的潜力,特别是在像三维领域这样的领域,隐式表示比显式表示更具灵活性。」
Shap-E 的开发者承认,与 Point-E 的点云方法相比,大规模使用的计算能力可能较高。这款 AI 在理解如何制作一些复杂物体方面仍然存在困难,但总体而言,其结果在成功方面非常显著。
0000
评论列表
共(0)条相关推荐
15年了 谷歌走到了一个十字路口
北京时间5月10日消息,北京时间周四凌晨1点,谷歌第15届I/O开发者大会将在加州山景城拉开帷幕。但是这一次,谷歌压力山大,因为这家搜索巨头在其长期主导的人工智能(AI)领域突然落入了苦苦追赶的境地。站长网2023-05-10 10:02:270000微信:从严治理卖惨诱导打赏、虚假贫困摆拍等行为
微信发布《关于加强网络不良信息治理的公告》称,为进一步规范自媒体行为,平台持续对各类网络不良信息开展深入治理。平台针对散布虚假谣言信息,卖惨诱导打赏,虚假贫困摆拍等行为进行从严治理,并进一步加强对宣扬鼓吹“丧文化”和散布不良价值观等内容的治理。站长网2023-06-09 20:57:080000Meta 开源 MusicGen 模型:用 AI 将文本和旋律结合 创造全新音乐作品
Meta的MusicGen可以根据文本提示生成短小的新音乐片段,并可选择与现有旋律对齐。与今天的大多数语言模型一样,MusicGen基于Transformer模型。就像语言模型预测句子中的下一个字符一样,MusicGen预测音乐作品中的下一个部分。站长网2023-06-12 22:57:150002天猫新规禁止商家引流微信私域
天猫在近日对一项「诱导第三方规则」进行了新调整,其中明确禁止了商家包裹卡引流到其他平台的行为。虽然没有明确指出是哪些平台,但在其另一份解释的文档中,诸多示例都露出了LOGO,尤其暗示引流微信的行为。根据公示新规所示,新调整将于7月1日正式生效,商家一旦被发现有此行为,将面临严厉处罚,包括商品下架、扣分、甚至清退等。站长网2024-06-25 15:18:380001阿里云盘将对超限账户实施新策略 限制在线播放、上传等功能
站长之家(ChinaZ.com)2月7日消息:近日,阿里云盘宣布自2024年3月1日起,将对容量超出使用限制的账户执行新政策。这意味着,对于超出存储容量的用户,其在线播放、上传、转存、下载、分享和快传等功能可能会受到一定程度的限制。站长网2024-02-07 08:45:280001