HumanGaussian开源:基于Gaussian Splatting的高质量3D人体生成新框架
要点:
结构感知的SDS引入人体结构先验,同时优化外观和几何形状。
通过退火的负文本引导,确保真实结果,避免过度饱和和消除浮动伪影。
HumanGaussian框架能够生成多样、逼真的高质量3D人体模型,展现真实外观和细粒度的细节。
在3D生成领域,为了实现高质量的3D人体外观和几何形状,研究者们一直在探索自动化的生成方法。传统方法需要经历多个人工制作步骤,而最新的HumanGaussian框架通过结构感知的SDS和负文本引导等核心方法,成功解决了3D人体生成中效率与质量之间的权衡问题。
HumanGaussian引入了结构感知的SDS,利用SMPL-X网格形状初始化3D高斯中心位置。相较于以往的方法,这一框架通过缩放和变换实现合理的人体尺寸,并在3D空间中居中,为3D生成提供了更全面的初始信息。通过SDS源模型,结合RGB和深度图的结构专家分支,研究者成功构建了一个统一的模型,同时捕获外观的图像纹理和前景/背景关系的结构,促进了3D高斯的学习过程。
项目地址:https://github.com/alvinliu0/HumanGaussian
为了解决3D生成内容与文本之间的对齐问题,HumanGaussian采用了退火的负文本引导,通过结合两个分数进行监督。相较于传统方法中较大的无分类器引导尺度,这一方法能够更清晰地指导SDS损失,避免损害训练稳定性。实验证明,负文本分类器分数的退火可以在小时间步长内提高质量,同时保持稳定性,使生成更真实,消除了浮动伪影。
在性能对比实验中,HumanGaussian在3D人体生成领域取得了优越的成果,展现出更真实的外观、更连贯的结构、更好的视图一致性以及更细粒度的细节捕捉。这一创新框架的开源将有助于推动相关领域的研究和应用,为虚拟试穿、沉浸式远程呈现等应用提供更高质量的3D人体生成解决方案。
HumanGaussian作为一种有效而快速的3D人体生成框架,通过结构感知的SDS和负文本引导的创新方法,成功地平衡了效率和质量,为高质量、真实的3D人体模型的生成提供了新的思路和解决方案。这一框架的开源将为相关研究者提供有力工具,推动3D生成领域的发展。
消息称因价格太低无利可图,纬创退出苹果印度代工业务
IT之家5月22日消息,据Indiatimes报道,第一家在印度生产iPhone的公司纬创(Wistron)近日已退出在印度的苹果代工业务,称苹果公司在价格上的强硬谈判导致该公司无法从中获得利润。站长网2023-05-24 12:24:520000捐出大部分财富!OpenAI CEO奥特曼格局拉满:至少140亿元
快科技5月29日消息,据国外媒体报道,OpenAI首席执行官萨姆奥特曼及其丈夫奥利弗穆尔赫林宣布加入捐赠誓言,承诺捐出他们的大部分财富。奥特曼的身价至少为20亿美元(约合人民币144亿元),其中大部分财富来源于其对初创企业的投资,特别是对Reddit的成功投资。值得注意的是,尽管奥特曼在人工智能领域取得了巨大成功,但他并未持有OpenAI的股份。站长网2024-05-29 18:05:540000Meta向名人支付数百万美元,复刻名人版聊天机器人
划重点:-Meta(Facebook的母公司)支付数百万美元给名人进而打造名人版AI聊天机器人。-一位不愿透露姓名的名人以短短六小时的工作时间获得高达500万美元的报酬,成为AI之一。-Meta计划将这些虚拟名人扩展到视频交流领域。站长网2023-10-13 11:56:250000谷歌在 Pixel 8 Pro 上推出首个 AI Core 更新
谷歌今天推出了一项名为AICore的新Google应用程序更新。根据GooglePlay商店的描述,AICore将为GooglePixel8Pro手机的Android系统和应用程序提供最新的AI模型支持,以及其他一系列AI驱动功能。0000GPT-4o 17人Omni金牌团队首揭秘!清北上交中科大6位华人领衔
几天前的发布会上,OpenAI再次向全世界证明,它永远走在AI领域的最前沿。眼看着《Her》中的Samantha在自己眼前成真,那一刻,全世界为之振奋。就在刚刚,GPT-4o的关键团队信息,也被公布了出来。就是这个名为「omni」的团队,发挥出了不可思议的潜力,让OpenAI的首个原生全多模态模型成为可能。站长网2024-05-17 09:05:370000