HumanGaussian开源:基于Gaussian Splatting的高质量3D人体生成新框架
要点:
结构感知的SDS引入人体结构先验,同时优化外观和几何形状。
通过退火的负文本引导,确保真实结果,避免过度饱和和消除浮动伪影。
HumanGaussian框架能够生成多样、逼真的高质量3D人体模型,展现真实外观和细粒度的细节。
在3D生成领域,为了实现高质量的3D人体外观和几何形状,研究者们一直在探索自动化的生成方法。传统方法需要经历多个人工制作步骤,而最新的HumanGaussian框架通过结构感知的SDS和负文本引导等核心方法,成功解决了3D人体生成中效率与质量之间的权衡问题。
HumanGaussian引入了结构感知的SDS,利用SMPL-X网格形状初始化3D高斯中心位置。相较于以往的方法,这一框架通过缩放和变换实现合理的人体尺寸,并在3D空间中居中,为3D生成提供了更全面的初始信息。通过SDS源模型,结合RGB和深度图的结构专家分支,研究者成功构建了一个统一的模型,同时捕获外观的图像纹理和前景/背景关系的结构,促进了3D高斯的学习过程。

项目地址:https://github.com/alvinliu0/HumanGaussian
为了解决3D生成内容与文本之间的对齐问题,HumanGaussian采用了退火的负文本引导,通过结合两个分数进行监督。相较于传统方法中较大的无分类器引导尺度,这一方法能够更清晰地指导SDS损失,避免损害训练稳定性。实验证明,负文本分类器分数的退火可以在小时间步长内提高质量,同时保持稳定性,使生成更真实,消除了浮动伪影。
在性能对比实验中,HumanGaussian在3D人体生成领域取得了优越的成果,展现出更真实的外观、更连贯的结构、更好的视图一致性以及更细粒度的细节捕捉。这一创新框架的开源将有助于推动相关领域的研究和应用,为虚拟试穿、沉浸式远程呈现等应用提供更高质量的3D人体生成解决方案。
HumanGaussian作为一种有效而快速的3D人体生成框架,通过结构感知的SDS和负文本引导的创新方法,成功地平衡了效率和质量,为高质量、真实的3D人体模型的生成提供了新的思路和解决方案。这一框架的开源将为相关研究者提供有力工具,推动3D生成领域的发展。
最高便宜1600元!iPhone16官旗多款机型破发
在2024年的双11购物节期间,苹果公司对发布仅一个月的iPhone16系列进行了官方降价,这标志着自新机发布以来在官方渠道的首次价格下调。0000华为盘古大模型将公布重大升级:7月7日开发者大会正式揭晓
快科技6月26日消息,华为开发者大会2023(HDC.Cloud2023)将于7月7日在东莞举办。目前华为已经公布了此次会议的主题演讲议程,AI占据了不少内容,尤其是华为云盘古大模型将迎来重大升级。议程显示,华为常务董事、华为云CEO张平安将带来一切皆服务,AI重塑千行百业”主题演讲。站长网2023-06-27 17:06:490005网红偷税、炫富惨遭封杀,又一个大V倒下了
百万粉网红柏公子偷税被罚超1330万在网红经济时代,被推向流量神坛的头部主播们成为了互联网第一批吃螃蟹的人。直到现在,主播们随便一场直播,GMV规模动辄就达千万甚至1亿、个人收入达百万,这也不是什么稀罕事。就如带货一姐薇娅曾心直口快地表示,“当明星哪有当主播赚钱”。与此同时,带货主播们的税收也成为网友们关切的事情,尽管此前已有不少主播倒在了税收问题上,似乎有些主播还存在侥幸心理。站长网2024-12-19 14:07:000000苹果发布iOS 17 语音助手不用再说“嘿 Siri”了
今日凌晨,苹果发布了iOS17预览版,为电话app、FaceTime通话app和信息app的通信体验带来重大提升,iOS17还带来两项全新体验:Journalapp以及StandBy功能。支持设备方面,iOS17不再支持iPhone8、iPhone8Plus和iPhoneX三款机型。站长网2023-06-06 16:24:520000Meta发布高效SAM模型EffcientSAM 速度提升20倍!
继万物皆可分割的SAM模型后,Meta又发布了更高效的EfficientSAM模型。EfficientSAM是一项创新性的工作,旨在降低SAM模型的计算复杂性,使其在更广泛的实际应用中表现出色。该模型通过引入掩码图像预训练(SAMI)成功降低了SAM模型的计算复杂性,实现了速度提升20倍、参数减少20倍,同时性能仅损失约1.5mIoU。站长网2023-12-08 14:57:160003