POCO:用于3D人体姿势和形状估计的新型人工智能框架
要点:
通过2D图像估计3D人体姿态和形状是一个具有挑战性的任务,因为存在深度模糊、遮挡和不寻常的服装等问题。
传统方法在估计不确定性时存在一些限制,而POCO框架提供了一种改进方法,可以在单个前向传递中同时推断姿态参数和不确定性。
POCO框架引入了条件向量和图像特征来提高基本密度函数的建模,同时通过SMPL姿势来调整网络,从而提高了姿态重建和不确定性估计的准确性。
人体姿态和形状(HPS)的三维估计是重建现实世界中的人体行为所必需的。然而,从二维图像进行三维推断面临深度模糊、遮挡、不寻常的服装和运动模糊等挑战。即使最先进的HPS方法也会出现错误,通常对这些错误不太了解。
HPS是一个中间任务,提供了下游任务所需的输出,如理解人类行为或三维图形应用。这些下游任务需要一种机制来评估HPS结果的准确性,因此这些方法必须生成与HPS质量相关的不确定性(或置信度)值。
项目地址:https://poco.is.tue.mpg.de/
POCO框架的核心创新是"双重条件策略(DCS)",它增强了基本密度函数和规模网络。与先前的方法不同,POCO引入了一个条件向量(Cond-bDF)来建模推断的姿态误差的基本密度函数。POCO利用图像特征进行条件化,使其能够更好地适应多样性和复杂的图像数据集的训练。
此外,POCO的作者们引入了一种改进的方法,用于在HPS模型中估计不确定性。他们利用图像特征并将网络与SMPL姿态相结合,从而提高了姿态重建和更好的不确定性估计。他们的方法可以无缝集成到现有的HPS模型中,提高准确性而没有副作用。该研究声称这种方法在将不确定性与姿态错误相关方面优于最先进的方法。
POCO框架是一个创新的AI工具,用于三维人体姿态和形状的估计。它通过引入双重条件策略,改进基本密度函数和规模网络,显著提高了估计的准确性。这一方法可以应用于多样性和复杂图像数据集,使其成为一种有望推动人体行为分析和三维图形应用的关键技术。如果您对此感兴趣,不妨查看相关链接以了解更多详情。
IBM 发布开源模型 Granite Code,在编程任务中超过谷歌模型
划重点:🔍IBM发布了一套名为"GraniteCode"的专门用于编程的模型,这些模型在基准测试中超过了一些较大的开源竞争对手,并旨在帮助企业完成各种软件开发任务。🔍GraniteCode模型包括基础模型和指导模型,每种模型都有4个不同规模的变种,参数从30亿到340亿不等,通过对比评估表现出色。站长网2024-05-13 09:45:070000刚刚,一位机器人戴着毕业帽走出清华
这年头,人形机器人都有清华的学士帽戴!这位走出清华二校门的机器人,简直要把门口参加暑期研习营的小孩们馋哭了。不仅拥有清华紫学士帽,在刚刚结束的WAIC“具身通用人工智能”论坛上,这个名叫小星的人形机器人,还和图灵奖得主、中国科学院院士姚期智合影贴贴。是谁羡慕了?我不说。站长网2023-07-30 21:57:510000Pirros获200万美元种子轮融资,用AI简化建筑设计
文章概要:1.Pirros是一家应用AI简化建筑设计绘图的初创公司,获得200万美元种子轮融资。2.Pirros通过提取和索引建筑信息模型Metadata,将设计图纸集中存储和管理。3.Pirros计划利用资金扩大团队,改进产品,扩大市场。站长网2023-09-01 10:47:460000喵星人与汪星人的“逆袭”,那些出圈萌宠能够赚到钱吗?
如今,年轻人似乎患上了“宠物依赖症”,各大平台的宠物内容赛道快速发展,逐渐成为最受年轻人关注的垂类之一。随着年轻人养宠需求的升级,从宠物健康到时尚领域,宠物营销也成为了多领域品牌渗透年轻人圈层的热门方式,反哺萌宠内容的快速发展。然而,随着萌宠博主的增加,萌宠内容陷入了一定的同质化之中,萌宠博主出圈的难度愈发加大,变现也面临巨大的挑战。站长网2023-09-04 17:08:020001OpenAI与《大西洋月刊》和The Verge发行商Vox Media达成合作
划重点:⭐️OpenAI与TheAtlantic和VoxMedia分别达成合作,许可其内容用于训练大型语言模型。⭐️合作协议涉及许可费用和访问OpenAI技术,以及对内容和数据的使用。⭐️VoxMedia总裁PamWasserstein就合作发表了看法,强调AI技术对媒体业的重要性和保护知识产权。站长网2024-05-30 21:23:410000