Meta提出TextureDreamer:利用扩散模型生成完整的3D模型纹理贴图
站长网2024-01-19 11:01:034阅
高质量的3D内容对于AR/VR、机器人技术、电影和游戏等应用至关重要。然而,纹理的创作一直是视觉和图形领域的挑战之一。传统方法需要密集的视角采样和准确对齐的几何信息,而学习方法则受限于特定数据集内的类别形状。
论文地址:https://arxiv.org/pdf/2401.09416.pdf
本文提出了TextureDreamer方法,通过少量图像(3至5张)引导,实现了从真实环境中合成纹理并转移到任意对象的目标3D形状。其核心思想是个性化几何感知分数蒸馏(PGSD),结合了个性化建模、变分分数蒸馏和显式几何引导。与以往方法相比,TextureDreamer在纹理质量上取得了显著改进,成功实现了对不同几何形状的逼真、语义丰富的纹理转移。
实验证明,TextureDreamer超越了先前的最先进方法,极大地推动了纹理创作的民主化。通过对Dreambooth、ControlNet和分数蒸馏等关键技术的综合应用,TextureDreamer展现了在图像引导纹理合成领域的卓越性能。
0004
评论列表
共(0)条相关推荐
一款明星扮演游戏在小红书的走红
借助于低门槛、碎片化的图文分享形式,和独特的种草生态,以《怪我过分美丽》为代表,小红书正在独立游戏、主机游戏等领域形成较为独特的内容氛围。质疑208,理解208,成为208。一款能无痛体验娱乐圈顶流生活的游戏《怪我过分美丽》正在小红书形成自己的小据点。站长网2023-10-22 09:52:100000PixelPlayer:能自动从视频中识别和分离不同的声音源
PixelPlayer是MIT研究团队开发的项目,能够自动从视频中识别和分离出不同的声音源,并与画面位置匹配。这种能力使得系统能够识别视频中的不同声音来源,如不同乐器的声音,分别提取和分离这些声音源的声音,而无需人工标注数据。项目地址:https://top.aibase.com/tool/pixelplayer站长网2024-02-22 11:36:000001恒生电子发布金融行业大模型LightGPT
今天下午,恒生电子发布了金融行业的大模型LightGPT。该产品计划在9月底完成金融能力的新一轮升级,并正式开放试用接口。LightGPT利用超过4000亿个tokens的金融领域数据和超过400亿个tokens的语种增强数据进行了二次预训练,支持超过80个金融专属任务的微调。可以为投顾、客服、投研、运营、风控、合规、研发等金融业务场景提供底层的AI能力支持。站长网2023-06-29 11:34:550000第一款基于 OpenAI 的 ChatGPT GPT-4 技术的冥想应用 Ogimi.ai:为用户提供个性化冥想体验
Ogimi是一款基于OpenAI的ChatGPTGPT-4技术的平台,提供引导冥想的课程。图片来自OgimiOgimi创始人DavidGull在接受媒体采访时表示:「Ogimi是第一款由AI引导的冥想教练。这意味着平台上的每个冥想都是根据用户的特定需求和个人成长实时生成的。」站长网2023-06-27 16:03:580000Screenshot to Code:GPT-4 Vision助力 将网页屏幕截图秒变干净代码!
在当今快节奏的软件开发领域,将设计原型迅速转化为实际可用的代码是开发者和设计师们共同面临的挑战。现在有了一项革命性的技术——"ScreenshottoCode",它利用GPT-4Vision的强大能力,让这一转变变得前所未有的简单和高效。站长网2024-03-12 12:11:130000