AI透视眼!Wild2Avatar可逼真渲染视频中被遮挡的人物
**划重点:**
1. 🚀 **挑战与解决方案**:面对现有研究在理想条件下渲染3D人物的局限性,Wild2Avatar专注于解决真实场景中摄像头视野被遮挡导致部分遮挡的问题。
2. 🔍 **创新方法**:通过场景参数化,将场景分解为遮挡、人物和背景三个部分,并利用神经辐射场分别建模人物和遮挡/背景,以实现对被遮挡人物的准确渲染。
3. 🌟 **实验验证**:通过在野外视频上的实验证明,Wild2Avatar方法在解决真实世界场景下的挑战方面取得显著成效。
在渲染移动人物的视觉外观时,面对摄像头视野被遮挡的问题是一项巨大的挑战。大多数现有研究在理想条件下渲染3D人物,要求场景清晰且无障碍。然而,在真实世界场景中,可能会有障碍物阻挡摄像头视野,导致人物出现部分遮挡,这使得这些传统方法无法应用。
为了解决这一问题,著名人工智能教授李飞飞团队推出了Wild2Avatar,这是一种专为视频中被遮挡人物设计的神经渲染方法。
研究团队提出了一种考虑遮挡的场景参数化方法,将整个场景分解为遮挡、人物和背景三个部分。此外,我们设计了广泛的客观函数,以帮助强化人物与遮挡、背景的分离,并确保对人物模型的完整性。我们通过在野外视频上进行实验证明了我们方法的有效性。
方法介绍:
为了实现逼真的呈现,该方法将场景参数化为三个部分:遮挡物 → 人 → 背景,并通过新颖的优化目标将这些渲染解耦。为了处理在真实世界场景中可能出现的遮挡情况,该方法引入了感知遮挡的场景参数化,将场景解耦为遮挡、人和背景三个部分。此外,该方法设计了广泛的客观函数,以帮助强化将人从遮挡和背景中解耦,并确保人体模型的完整性。
具体来说,方法使用了场景的自分解技术,通过倒置球面参数化的扩展,引入了感知遮挡的场景参数化。在这个参数化中,除了第一个由倒置球面参数化定义的球体外,引入了第二个内部球体,并将从摄像机到内部球体边缘的区域定义为遮挡区域。通过分开渲染这个区域,可以将遮挡与场景的其余部分解耦。为了确保对人的高保真和完整呈现,方法通过像素级光度损失、场景分解损失、遮挡解耦损失和几何完整性损失的组合来聚合三个渲染。
该方法的贡献包括:
引入了感知遮挡的场景参数化,将场景解耦为遮挡、人体和背景三个部分。提出了一种新的渲染框架,分别渲染这三个部分,并设计了新颖的优化目标,以确保遮挡的清晰解耦和更完整的人体呈现。在具有挑战性的遮挡密集野外视频上对方法进行了评估,展示了其在呈现遮挡人体方面的有效性。
Wild2Avatar通过与Vid2Avatar(基线)和原始视频的对比,呈现了其在解决被遮挡人物渲染挑战方面的独特性能。
项目体验网址:https://top.aibase.com/tool/wild2avatar
论文网址:https://arxiv.org/pdf/2401.00431.pdf
马斯克豪掷40亿训Grok-3!红杉高盛大泼冷水,AI收支鸿沟或已达5000亿美元
【新智元导读】马斯克为Grok3要豪掷近40亿美元狂买10万张H100,GPT-6的训练则可能要耗资百亿。然而红杉和高盛近日都给行业泼了冷水:每年要挣6000亿美元才能支付的巨额硬件支出,换来的却只是OpenAI34亿美元的收入,绝大多数初创连1亿美元都达不到。而如果全世界的AI泡沫都被戳破,很可能就会导致新的经济危机。硅谷大厂的人工智能军备竞赛,还在加剧。站长网2024-07-08 10:29:100000美国成年人中只有 14% 尝试过 ChatGPT:十分之一用于工作
根据皮尤研究中心在三月份进行的一项调查,大约六成美国成年人(58%)熟悉ChatGPT,尽管很少有人亲自尝试过。在那些尝试过ChatGPT的人中,大多数报告认为它至少有些用处。站长网2023-05-25 17:34:010000OpenAI 宣布成立新团队以评估和防范人工智能模型可能带来的「灾难性风险」
OpenAI今天宣布,已成立一个名为「准备组」(Preparedness)的新团队,由麻省理工学院可部署机器学习中心的主任亚历山大·马德里(AleksanderMadry)领导,以评估、检测并预防人工智能模型可能导致的「灾难性风险」。站长网2023-10-27 09:06:560000大模型时代的OCR,“CPU” 的味道更重了
经典技术OCR(光学字符识别),在大模型时代下要“变味”了。怎么说?我们都知道OCR这个技术在日常生活中已经普及开了,像各类文件、身份证、路标等识别,可以说统统都离不开它。而随着近几年大模型的不断发展,OCR也迎来了它的“新生机”——凭借自身可以将文本从图片、扫描文档或其他图像形式提取出来的看家本领,成为大语言模型的一个重要入口。在这个过程中,一个关键问题便是“好用才是硬道理”。站长网2023-06-30 19:48:5600011OpenAI 打造媒体管理工具,让内容创作者可以选择退出 AI 训练
划重点:⭐OpenAI正在开发名为媒体管理(MediaManager)工具,让内容创作者可以指定其作品是否纳入AI研究和训练。⭐这一举措是为了回应对OpenAI数据采集方式的批评,同时保护知识产权和创作者利益。⭐除了OpenAI外,其他公司也在努力构建通用溯源和选择退出工具,以应对AI模型训练中的知识产权问题。站长网2024-05-08 21:42:480000