浙大研究团队推新AI框架Human101:单视角视频构就能重建3D数字人
划重点:
🚀创新技术:Human101采用3D高斯散点技术,在仅一视角视频中以100秒训练时间生成动态、高保真的3D数字人体模型。🎮实时渲染:以100 FPS的速度进行渲染,相较于先前方法实现更快速的渲染速度,提供可比较或更优渲染质量。💻开源项目:Human101将代码和演示发布于GitHub,为实时交互应用和沉浸式虚拟现实体验提供了可行性。
在虚拟现实领域,快速创建定制虚拟人物并实现与其互动是一个普遍的应用场景。然而,以往的方法在快速重建高保真3D数字人体和实时渲染之间往往难以平衡。在这项研究中,提出了Human101,这是一个新颖的框架,能够在仅一视角视频中以100秒的训练时间生成高保真的动态3D人体模型,并以100 FPS的速度进行渲染。

与以往的基于NeRF的管道不同,Human101巧妙地应用了人体中心的前向高斯动画方法,通过调整3D高斯的参数来提高渲染速度。实验证明,该方法在每秒帧数上取得了显著的增长,同时提供可比较或更高的渲染质量。
为解决传统方法中存在的渲染速度慢和收敛速度慢的问题,Human101采用了更实用和改进的方法。首先,采用光栅化渲染管线,取代传统的体素渲染方法,以提高渲染速度。其次,选择了一种更易于优化的表示方法,即3D高斯,从而将优化时间降低到几分钟。
Human101特色包括:
创新地采用3D高斯散点技术,为详细和准确的人体建模提供了高效的明确表示。引入了规范人体初始化方法,显著提高了模型的收敛速度和视觉细节表达。提出了一种包括人体中心的前向高斯动画和样本点 反向脱皮体渲染的变形方法,与传统的耗时的逆向脱皮框架不同,实现了实时快速重建和渲染动态人体。在推断阶段,相较于先前的神经人体表示,实现了渲染速度的约10.8倍提升(对于512×512分辨率的图像为100 FPS),同时确保了可比较或更高的渲染质量和更高的图像分辨率。
Human101通过引入创新的技术和实用的方法,成功地解决了单视角视频中快速建模和实时渲染之间的矛盾,为实时交互应用和沉浸式虚拟现实体验提供了可行的解决方案。
项目体验网址:https://top.aibase.com/tool/human101
论文网址:https://arxiv.org/pdf/2312.15258.pdf
经过5万小时训练,AI懂得玩《精灵宝可梦》了
划重点:1.西雅图软件工程师PeterWhidden花费了几年时间训练一个强化学习算法,使其能够玩经典的《精灵宝可梦》游戏,该AI已经进行了超过5万小时的游戏训练。2.AI的奖励模型奇特,它有时会陷入游戏中的某些地方,甚至停下来欣赏美丽的游戏场景,而不急于完成任务。3.AI还表现出对某些事件的“情感”,例如失去一只宝可梦后对宝可梦中心产生负面情感。站长网2023-10-19 10:40:5800002024京东双11活动时间公布: 10 月 14 日晚 8 点提前开始
昨日,京东宣布了2024年"双11"购物节的活动安排,今年的活动将从10月14日晚8点提前开始。2024年京东"双11"将分为五个阶段,首先是"抢先购",其次是"开门红",然后是"专场期",接着是"高潮期",最后是"返场期"。0000Vary-toy:具有高级视觉词汇视觉语音模型 适用于标准GPU
划重点:📌挑战与潜力:大型视觉语言模型(LVLMs)在计算机视觉(CV)和自然语言处理(NLP)交叉任务中表现出色,但在图像感知能力方面仍有潜力待发。📌模型结构:目前的LVLMs通常采用图像标记作为前缀或交叉注意力进行特征融合。然而,模型的效率可能受到视觉词汇网络在编码视觉信号方面的限制。站长网2024-01-31 11:41:340000图灵巨头现身ICLR,顶会现场疯狂追星LeCun、Bengio!中国团队三大技术趋势引爆AGI新想象
【新智元导读】这几天的维也纳,上演了一场AI圈的狂欢。在ICLR2024上,图灵巨头LeCun、Bengio纷纷现身,直接让现场挤爆,变成追星现场。这几天,AI届的盛会——ICLR在维也纳举办。OpenAI、Meta、谷歌、智谱AI等世界前沿AI科技企业齐聚一堂。现场名流云集,星光耀眼,走几步就能偶遇一位发过颠覆性paper的大咖。站长网2024-05-11 20:31:350000谷歌内部推出AI大语言模型Goose 主打代码编写、产品研发
据BusinessInsider报道,近日,谷歌内部秘密开发了一款名为“Goose”的人工智能大语言模型,据知情人士透露。这款AI工具被特别设计给谷歌工程师使用,融入了公司25年的技术积淀,目的是大幅度提高内部团队的工作效能,特别是在代码编写和新产品研发方面。站长网2024-02-18 09:13:340000