首页站长资讯一句话搞定3D模型纹理贴图，全程只需30秒，港大港中大TCL出品 | ICCV'23 Oral

一句话搞定3D模型纹理贴图，全程只需30秒，港大港中大TCL出品 | ICCV'23 Oral

站长网2023-08-27 13:43:090阅

用上扩散模型，3D物体生成纹理一句话就能搞定!

像是输入“一张带有棕色和黑色几何图案的椅子”，扩散模型就能立刻给它复个古，贴上颇具年代感的纹理:

甚至只是丢给它一张看不出桌面长啥样的“截图”，AI也能立刻凭借想象力，给桌面加上木质的细节纹理:

要知道，给3D物体加上纹理，可不只是“变变颜色”这么简单。

它包含粗糙度、反射、透明、漩涡、泛光等大量参数，要想设计好不仅需要了解材质、灯光、渲染等知识，还需要反复测试渲染效果并修改。如果材质有变，更是可能“重头来过”。

△游戏场景中纹理丢失的效果

然而，此前用AI设计出来的纹理又“不太能看”，因此设计纹理一直费时费力，成本也比较高。

现在，来自港大、港中文和TCL的研究人员，搞出了一种AI设计3D物体纹理的新方法，不仅完美保留物体之前的形状，而且设计出来的纹理真实感更强、完美贴合物体表面。

目前这项研究已经被ICCV2023收录Oral论文。

这究竟是怎么做到的?我们一起来看看。

用上扩散模型，3D纹理一句话搞定

此前用AI设计3D纹理，主要存在两类问题。

一类是生成的纹理不真实，细节有限:

另一类是生成过程中会对3D物体本身的几何做特殊处理，使得生成的纹理无法和原物体完美贴合，会“冒出”奇怪的形状:

因此，为了能确保3D物体结构稳定、同时生成细节逼真的纹理，这项研究设计了一个名叫Point-UV diffusion的框架。

这个框架包含“粗设计”和“精加工”两个模块，都基于扩散模型打造，不过二者用到的扩散模型有所不同。

首先在“粗设计”模块中，训练一个以形状特征（包括表面法线、坐标和遮罩）为输入条件的3D扩散模型，用来预测物体形状中每个点的颜色，从而生成一个粗糙纹理图像效果:

然后在“精加工”模块中，又设计了一个2D扩散模型，进一步将之前生成的粗糙纹理图像和物体形状作为输入条件，用来生成更加精细的纹理:

之所以采取这种设计结构，是因为之前的高分辨率点云生成方法，计算成本通常过高。

用这种两阶段生成的方法，不仅节省了计算成本，让两个扩散模型“各司其职”，而且相比之前的方法，不仅保留了原来3D物体的结构，生成的纹理也要更加精细。

至于通过输入文字或图片控制生成效果，则是CLIP的“功劳”。

针对输入，作者会先用预训练的CLIP模型提取文本或图像embeddings，然后将它输入一个MLP模型中，最终将条件整合进“粗设计”和“精加工”两阶段的网络中。

这样一来，就能实现通过文字和图像控制生成的纹理，从而得到最终输出结果。

所以，这样的模型实现效果究竟如何?

生成速度从10分钟缩短至30秒

先来看看Point-UV diffusion的生成效果。

从效果图中可见，除了桌椅，Point-UV diffusion同样还能生成汽车等物体的纹理，种类更丰富:

不仅能根据文字生成纹理:

也能根据一张图像生成对应物体的纹理效果:

除此之外，作者们还将Point-UV diffusion生成纹理效果与之前的方法做了个对比。

从图中可见，与Texture Fields、Texturify、PVD-Tex等其他纹理生成模型相比，Point-UV diffusion在结构和精细度上都表现出了更好的效果。

作者还提到，同样硬件配置下，相比Text2Mesh需要10分钟的计算，Point-UV diffusion只需要30秒。

不过，作者也提到了Point-UV diffusion目前还存在的一些局限之处，例如当UV贴图存在太多“碎片化”的部分时，它还是无法生成无缝的纹理效果。此外，由于依赖3D数据进行训练，而3D 数据的精细化质量和数量目前还不能达到2D 数据的水平，生成的效果暂时还无法达到像2D图像生成那么精细化的效果。

对这项研究感兴趣的小伙伴，可以戳下方论文看看~

论文地址:

https://cvmi-lab.github.io/Point-UV-Diffusion/paper/point_uv_diffusion.pdf

项目地址（还在施工中）:

https://github.com/CVMI-Lab/Point-UV-Diffusion

—完—

一句话搞定3D模型纹理贴图全程只需30秒港大港中大TCL出品ICCVx2723 Oral

0000

评论列表

共(0)条

相关推荐

站长资讯
腾讯智影宣布声音模型大升级：更自然流畅、语调情感更丰富
腾讯智影宣布声音模型大升级，具体提升包括更自然流畅、语调情感更丰富、减少语音瑕疵和适应性更好。新版本声音更加自然连贯，具有更丰富的语调和情感，减少了语音瑕疵的出现概率，并能更好地适应不同文本内容和语境。同时，智影还推出了两款免费新音色，分别是热情似火的女声和可爱亲切的女声，适用于对话闲聊场景。此外，声音定制效果也有所升级，采样率从16K升级到24K，用户可以定制同样升级版效果的音色。
站长网2024-05-24 11:06:14
0000
站长资讯
十块，低价过品直播爆红，“郑香香们”还能火多久
在真正的低价面前，所有直播套路似乎都显得黯然失色。近期，抖音主播“郑香香”因“低价过品直播”走红。从拖鞋、衣架到T恤，来不及介绍商品名称，她就直接报出价格“十块”，没等观众回过神，下一个商品已经出现在屏幕前。新榜旗下抖音数据工具新抖显示，“郑香香”仅一个月直播场观近1.5亿，预估销售额在7500万元至一亿元。
站长网2023-10-19 17:01:09
0000
做好知识付费直播间的10个“真相”
2周以前，跟一个朋友有一场线上直播对谈。这次直播对谈的主题是:关于知识付费直播间的“真相”。我对谈的这位朋友，叫Irene，是一家头部知识付费MCN公司的创始人，也是我们“新个体创业赋能计划”的内测课成员之一。她之前一手打造孵化过几十个知识付费的万人在线直播间（而且基本不用投流），在知识付费直播间的运营技术方面，绝对是业界顶尖的。
站长网站长资讯2023-12-06 15:14:55
0000
站长资讯
Sora三巨头首次解密幕后信息，CTO：最快年内开放
“Sora最快今年内开放公测。”在一场访谈中，OpenAICTOMiraMurati亲自透露了这一消息。短短10分钟里，Sora技术细节、进展、规划等当下最热议的问题，都有了更进一步解答:生成20秒的720P视频只需几分钟计算资源远超ChatGPT和DALL·E目前正在进行正在进行红队测试未来版本有望支持视频声效而且还向外界传递了一层重要信息:
站长网2024-03-25 11:18:43
0000
站长资讯
OPPO Reno11官宣将于11月23日发布
OPPO正式宣布了新机OPPOReno11系列的发布，这款手机将由演员朱一龙代言，并推出全新的“月光宝石”配色。这款新机将于11月23日14点正式亮相。OPPOReno11系列的摄像头Deco延续了上一代的设计语言，被官方称为“视界之窗”。该机型的镜头模组采用长椭圆设计，三颗镜头采用非对称排列，具有较高的辨识度。
站长网2023-11-15 18:08:56
0000