BeLFusion:一种基于行为潜空间的人体运动预测方法
站长网2023-08-04 18:17:510阅
BeLFusion 是一种基于行为潜空间的人体运动预测方法,旨在生成更加真实和多样化的人体运动序列。该方法通过将行为与运动分离,实现从观察到预测姿势的平滑过渡。BeLFusion 的创新架构包括行为 VAE 和条件潜空间扩散模型(LDM),通过这些组件,它能够生成更自然、上下文适应的运动预测。
项目地址:https://github.com/BarqueroGerman/BeLFusion
特点:
1. 行为潜空间:BeLFusion 引入了行为潜空间,使得预测的运动序列更加多样化和真实。
2. 行为 VAE:通过行为编码器、行为耦合器、上下文编码器和辅助解码器组成的行为 VAE,将关节坐标映射到潜空间,生成多样化且上下文适应的运动序列。
3. 条件潜空间扩散模型:BeLFusion 利用 LDM 从潜空间中采样,实现行为与姿势和运动的解耦,以增加预测的多样性和一致性。
4. 高泛化能力:BeLFusion 在不同数据集和动作类别上表现出优秀的泛化能力,超过了同类方法在准确度指标上的表现。
0000
评论列表
共(0)条相关推荐
麻省理工、Meta开源:无需人工标注,创新文生图模型
文生图领域一直面临着一个核心难题,就是有条件图像生成的效果,远超无条件的图像生成。有条件图像生成是指模型在生成图像的过程中,会额外使用类别、文本等辅助信息进行指导,这样可以更好的理解用户的文本意图,生成的图像质量也更高。而无条件图像生成完全基于模型自己学习的数据分布,难以形成有效的指导,所以,我们经常会有的AI平台生成的图像驴唇不对马嘴,或者图像有重大缺陷。0000Adobe研究人员研发新AI模型LRM:实现从2D样本瞬时生成3D图像
**划重点:**1.💡AdobeResearch和澳大利亚国立大学(ANU)联合宣布,他们研发出首个能够从单一2D图像生成3D图像的人工智能模型。2.💻新算法基于大规模图像样本训练,能够在几秒钟内生成高质量的3D图像,该算法采用了名为LRM(LargeReconstructionModel)的高度可扩展神经网络,包含一百万数据集和五亿参数。站长网2023-11-14 10:52:3300007天涨粉130万!爆红的大冰突然停播,放弃“泼天富贵”
靠直播间口碑逆袭后,大冰停播了。10月16日,他发文表示“泼天富贵,镜花水月;莫等莫催,暂不开播;这波流量,无缘承接”,宣布自己正式停播。截至目前,大冰已经有4天未在快手开播,账号评论区里有不少留言呼唤其回归。提起大冰,许多人的印象可能还停留在那一长串的自我介绍上:作家、首席主持人、高校导师、民谣歌手、老背包客、酒吧掌柜、油画画师、手鼓艺人、业余诗人、黄金左脸、禅宗临济弟子……站长网2024-10-18 23:36:480000周鸿祎预言2024年大模型将无处不在 多模态能力成国产标配
近日,在清华大学举行的演讲中,360集团创始人周鸿祎对2024年大模型的发展趋势进行了深刻的预测,引发了业界的广泛关注。周鸿祎首先指出,与操作系统不同,大模型将呈现无处不在的趋势,更类似于电脑的普及。在他看来,大模型不会被垄断,而是将成为各领域的关键支持技术。其中,他特别强调了多模态能力在国产大模型中的重要性,预言明年多模态能力将成为国产大模型的标配。0000AI生图格局大震!Stable Diffusion 3开源倒计时,2B单机可跑碾压闭源Midjourney
重磅消息!StableDiffusion3,大概率会在明天开源。距离2月SD3的横空出世,已经过去了4个月。如果此事为真,生图圈子第一个出现开源碾压闭源的奇景!强大的MMDiT全新架构,将彻底改变AI生图的格局。现在,全体AI社区都在翘首以盼。万众瞩目的StableDiffusion3,终于要正式开源了!站长网2024-06-12 16:03:090001