首页站长资讯浙大研究团队推新AI框架Human101:单视角视频构就能重建3D数字人

浙大研究团队推新AI框架Human101:单视角视频构就能重建3D数字人

站长网2023-12-29 17:03:450阅

划重点:

🚀创新技术:Human101采用3D高斯散点技术，在仅一视角视频中以100秒训练时间生成动态、高保真的3D数字人体模型。🎮实时渲染:以100 FPS的速度进行渲染，相较于先前方法实现更快速的渲染速度，提供可比较或更优渲染质量。💻开源项目:Human101将代码和演示发布于GitHub，为实时交互应用和沉浸式虚拟现实体验提供了可行性。

在虚拟现实领域，快速创建定制虚拟人物并实现与其互动是一个普遍的应用场景。然而，以往的方法在快速重建高保真3D数字人体和实时渲染之间往往难以平衡。在这项研究中，提出了Human101，这是一个新颖的框架，能够在仅一视角视频中以100秒的训练时间生成高保真的动态3D人体模型，并以100 FPS的速度进行渲染。

与以往的基于NeRF的管道不同，Human101巧妙地应用了人体中心的前向高斯动画方法，通过调整3D高斯的参数来提高渲染速度。实验证明，该方法在每秒帧数上取得了显著的增长，同时提供可比较或更高的渲染质量。

为解决传统方法中存在的渲染速度慢和收敛速度慢的问题，Human101采用了更实用和改进的方法。首先，采用光栅化渲染管线，取代传统的体素渲染方法，以提高渲染速度。其次，选择了一种更易于优化的表示方法，即3D高斯，从而将优化时间降低到几分钟。

Human101特色包括:

创新地采用3D高斯散点技术，为详细和准确的人体建模提供了高效的明确表示。引入了规范人体初始化方法，显著提高了模型的收敛速度和视觉细节表达。提出了一种包括人体中心的前向高斯动画和样本点反向脱皮体渲染的变形方法，与传统的耗时的逆向脱皮框架不同，实现了实时快速重建和渲染动态人体。在推断阶段，相较于先前的神经人体表示，实现了渲染速度的约10.8倍提升（对于512×512分辨率的图像为100 FPS），同时确保了可比较或更高的渲染质量和更高的图像分辨率。

Human101通过引入创新的技术和实用的方法，成功地解决了单视角视频中快速建模和实时渲染之间的矛盾，为实时交互应用和沉浸式虚拟现实体验提供了可行的解决方案。

项目体验网址:https://top.aibase.com/tool/human101

论文网址:https://arxiv.org/pdf/2312.15258.pdf

浙大研究团队推新AI框架Human101单视角视频构就能重建3D数字人

0000

评论列表

共(0)条

相关推荐

站长资讯
经过5万小时训练，AI懂得玩《精灵宝可梦》了
划重点:1.西雅图软件工程师PeterWhidden花费了几年时间训练一个强化学习算法，使其能够玩经典的《精灵宝可梦》游戏，该AI已经进行了超过5万小时的游戏训练。2.AI的奖励模型奇特，它有时会陷入游戏中的某些地方，甚至停下来欣赏美丽的游戏场景，而不急于完成任务。3.AI还表现出对某些事件的“情感”，例如失去一只宝可梦后对宝可梦中心产生负面情感。
站长网2023-10-19 10:40:58
0000
2024京东双11活动时间公布： 10 月 14 日晚 8 点提前开始
昨日，京东宣布了2024年"双11"购物节的活动安排，今年的活动将从10月14日晚8点提前开始。2024年京东"双11"将分为五个阶段，首先是"抢先购"，其次是"开门红"，然后是"专场期"，接着是"高潮期"，最后是"返场期"。
站长网站长资讯2024-10-14 19:32:35
0000
站长资讯
Vary-toy：具有高级视觉词汇视觉语音模型适用于标准GPU
划重点:📌挑战与潜力:大型视觉语言模型（LVLMs）在计算机视觉(CV)和自然语言处理(NLP)交叉任务中表现出色，但在图像感知能力方面仍有潜力待发。📌模型结构:目前的LVLMs通常采用图像标记作为前缀或交叉注意力进行特征融合。然而，模型的效率可能受到视觉词汇网络在编码视觉信号方面的限制。
站长网2024-01-31 11:41:34
0000
站长资讯
图灵巨头现身ICLR，顶会现场疯狂追星LeCun、Bengio！中国团队三大技术趋势引爆AGI新想象
【新智元导读】这几天的维也纳，上演了一场AI圈的狂欢。在ICLR2024上，图灵巨头LeCun、Bengio纷纷现身，直接让现场挤爆，变成追星现场。这几天，AI届的盛会——ICLR在维也纳举办。OpenAI、Meta、谷歌、智谱AI等世界前沿AI科技企业齐聚一堂。现场名流云集，星光耀眼，走几步就能偶遇一位发过颠覆性paper的大咖。
站长网2024-05-11 20:31:35
0000
站长资讯
谷歌内部推出AI大语言模型Goose 主打代码编写、产品研发
据BusinessInsider报道，近日，谷歌内部秘密开发了一款名为“Goose”的人工智能大语言模型，据知情人士透露。这款AI工具被特别设计给谷歌工程师使用，融入了公司25年的技术积淀，目的是大幅度提高内部团队的工作效能，特别是在代码编写和新产品研发方面。
站长网2024-02-18 09:13:34
0000