解决Sora物理bug！四所美国顶尖高校联合发布PhysDreamer模型

站长网2024-05-06 20:34:460阅

Sora视频生成器发布后不久，就被网友发现存在物理交互的bug，例如模型对物理世界的理解不足，导致小狗走路时前腿出现不自然的交错问题。为了解决这一问题，提升视频生成的真实感，来自MIT、斯坦福大学、哥伦比亚大学和康奈尔大学的研究人员联合提出了一种基于物理的方法模型——PhysDreamer。

项目地址：https://top.aibase.com/tool/physdreamer

论文链接:https://arxiv.org/pdf/2404.13026.pdf

PhysDreamer利用视频生成模型学习到的对象动力学先验，为静态3D对象赋予交互式动力学。通过提炼这些先验知识，PhysDreamer能够合成现实物体对全新交互的响应，如外力或智能体操作，并在弹性物体的不同示例上展现了该方法的效果。

问题形式化

PhysDreamer的目标是估计对象的物理材料属性场，以实现真实的交互式运动合成。具体来说，就是估计3D物体的空间变化杨氏模量场E（x），以进行粒子模拟。杨氏模量用来测量材料的刚度，决定物体响应外力作用的运动轨迹。

模型架构

PhysDreamer通过生成运动中物体的可信视频，然后优化材料场E（x）以匹配合成运动。给定一个表示为3D高斯的对象，首先从某个视点进行渲染，然后使用图像到视频生成模型来生成运动中物体的参考视频。接着，使用可微分材质点方法(MPM)和可微分渲染，对空间变化的材质场和初始速度场进行优化，旨在最小化渲染视频和参考视频之间的差异。

实验结果

研究人员收集了八个真实世界的静态场景，并捕捉了四个交互视频来说明其在交互后的自然运动。在用户研究中，超过80%的参与者在两项选择实验中更倾向于PhysDreamer模型，认为其在运动的真实性上更胜一筹;在视觉质量方面，也有65%的参与者更偏好PhysDreamer。

PhysDreamer模型的发布，为解决视频生成中的物理交互问题提供了一种有效的解决方案。通过估计物体的物理材料属性，PhysDreamer能够合成更加逼真的物体动态行为，显著提升了视频生成的真实感。这一研究成果有望推动视频生成技术的发展，为未来的应用带来更多可能性。

解决Sora物理bug四所美国顶尖高校联合发布PhysDreamer模型

0000

评论列表

共(0)条

相关推荐

站长资讯
华为盘古大模型5.0、全新小艺将于6月21日发布
站长之家（ChinaZ.com）6月18日消息:华为官方今日宣布，盘古大模型5.0和全新小艺将于6月21日开幕的华为开发者大会上正式亮相。此次大会不仅将迎来这两款创新产品的登场，还将有纯血鸿蒙系统同台竞艳，共同展现华为在人工智能和操作系统领域的最新成果。
站长网2024-06-18 20:02:08
0000
站长资讯
小米发布新款手机采用相机式设计
小米发布了新款小米13Ultra，其背面设计看起来非常像相机，尤其是徕卡M系列。这款手机还采用了独特的绒面皮革拼接设计和弧形过渡方案，与相机类似。小米13Ultra的设计独特，从市场上的其他智能手机中脱颖而出。它可能会吸引那些正在寻找具有独特外观的手机的消费者。
站长网2023-04-18 20:09:29
0001
站长资讯
混战数月后，国产AI办公神器彻底学会“自己办公”了吗？
简历上的“精通各种办公软件”，堪称21世纪最大的谎言。入职前:精通各种办公软件入职后:不知道怎么把Word的空白页删掉，最后选择物理删除——打印出来把空白页扔掉。不过说真的，这些现在可能也不重要了。随着越来越多的办公软件卷起了AI，办公软件都快晋升成为合格的打工人，学会自己办公了。
站长网2023-06-16 20:15:03
0003
小米15屏幕参数公布：M9发光材料 1.38mm超窄四等边直屏
今日，小米15系列手机的屏幕参数正式公布，该机型配备了一块被称为“超级阳光屏”的显示屏，其特点是拥有令人惊艳的1.38mm超窄四等边设计。这款屏幕采用了独家定制的M9发光材料和双微腔屏幕结构，使得发光效率在同类产品中领先，同时实现了屏幕功耗下降10%。此外，该屏幕还支持全亮度DC调光和全屏AOD（AlwaysOnDisplay）锁屏功能，为用户提供了更舒适的视觉体验。
站长网站长资讯2024-10-25 15:10:10
0000
站长资讯
Publicis 将在未来三年投资 3 亿欧元的人工智能计划
划重点:-📈Publicis计划在未来三年投资3亿欧元（3.27亿美元）用于人工智能领域，旨在成为“首个以人工智能为核心的智能系统”的行业领导者。-💰该计划中，2024年将独立投资1亿欧元，完全由“内部效率”资金支持，并不会对公司运营利润率造成负面影响。
站长网2024-01-25 16:33:41
0000