新型人工智能框架Rodin来了!可从多种输入源生成 3D 数字化身
站长网2023-07-27 09:58:583阅
Rodin 是一个新颖的人工智能框架,可以从不同的输入源生成3D 数字化身。该框架利用了扩散模型和生成模型来生成逼真的3D 内容。与2D 内容相比,生成3D 内容面临着更多的挑战,包括内存和处理成本的限制。
论文地址:https://arxiv.org/pdf/2212.06135.pdf
Rodin 的创新之处在于它可以根据图像、随机噪声或者文字描述生成3D 数字化身。它采用扩散过程生成数字化身的粗糙几何结构,并通过扩散上采样器进行细节合成。Rodin 提供了目前最尖锐的数字化身,并且在生成样本中没有可见的伪影。该框架在计算和内存效率上也做了很好的优化,使用三平面表示法来减少内存占用。
最终,通过轻量级的 MLP 解码器生成 RGB 体积图像。这项研究对电影、游戏、元宇宙和3D 行业中数字化身的应用具有重要意义。
0003
评论列表
共(0)条相关推荐
戴着Vision Pro做饭!爆卖20万台首发测评解禁:又贵又重槽点满满,网友直呼拔草了
【新智元导读】昨晚10点,苹果VisionPro的保密封印正式解除,外媒博主们纷纷放出测评,网友们看完第一印象:好贵!好重!VisionPro,如今已经狂卖20万台!所以,这款被苹果寄望于「打造新时代的空间计算机」的设备,用起来到底怎样?昨晚10点,保密封印正式解除了。媒体和大V们纷纷放出测评,果粉和VR发烧友们激动地掀起连夜狂欢!准备好,一大波测评来袭!站长网2024-01-31 16:38:070000微软写了份GPT-4V说明书:166页讲解又全又详细,提示词demo示例一应俱全 | 附下载
多模态王炸大模型GPT-4V,166页“说明书”重磅发布!而且还是微软团队出品。什么样的论文,能写出166页?不仅详细测评了GPT-4V在十大任务上的表现,从基础的图像识别、到复杂的逻辑推理都有展示;还传授了一整套多模态大模型提示词使用技巧——手把手教你从0到1学会写提示词,回答专业程度一看就懂,属实是把GPT-4V的使用门槛打到不存在了。站长网2023-10-09 09:05:570000MyShell AI开发高质量语音合成工具MeloTTS 支持中英混合发音
MeloTTS是由MyShellAI开发的一个高质量的多语言文本到语音(TTS)库。这个库支持英语、西班牙语、法语、中文、日语和韩语等多种语言,使其在全球范围内具有广泛的应用价值。项目地址:https://top.aibase.com/tool/melotts站长网2024-02-27 11:10:360006电脑里破解软件又少一款!Win11原生录屏免费平替了:新增快捷键
快科技4月11日讯,去年12月,Windows11自带截图工具升级到了version11.2211.11.0版本后,录屏功能终于上线。据WL报道,微软正在开发一组新的Windows11键盘快捷键,即WinShiftR,按下后会弹出录制警告,点击开始即可,点击关闭后视频将被保存在本地。站长网2023-04-12 13:49:010000Stable Diffusion 3突然发布!与Sora同架构,一切都更逼真了
StableDiffusion3,它终于来了!足足酝酿一年之多,相比上一代一共进化了三大能力。来,直接上效果!首先,是开挂的文字渲染能力。且看这黑板上的粉笔字:GoBigorGoHome(不成功便成仁),这个倒是杀气腾腾啊~路牌、公交灯牌的霓虹效果:还有刺绣上“勾”得快要看到针脚的“晚安”:作品一摆出,网友就大呼:太精确了。站长网2024-02-23 09:07:570000