解决Sora物理bug!四所美国顶尖高校联合发布PhysDreamer模型
Sora视频生成器发布后不久,就被网友发现存在物理交互的bug,例如模型对物理世界的理解不足,导致小狗走路时前腿出现不自然的交错问题。为了解决这一问题,提升视频生成的真实感,来自MIT、斯坦福大学、哥伦比亚大学和康奈尔大学的研究人员联合提出了一种基于物理的方法模型——PhysDreamer。
项目地址:https://top.aibase.com/tool/physdreamer
论文链接:https://arxiv.org/pdf/2404.13026.pdf
PhysDreamer利用视频生成模型学习到的对象动力学先验,为静态3D对象赋予交互式动力学。通过提炼这些先验知识,PhysDreamer能够合成现实物体对全新交互的响应,如外力或智能体操作,并在弹性物体的不同示例上展现了该方法的效果。
问题形式化
PhysDreamer的目标是估计对象的物理材料属性场,以实现真实的交互式运动合成。具体来说,就是估计3D物体的空间变化杨氏模量场E(x),以进行粒子模拟。杨氏模量用来测量材料的刚度,决定物体响应外力作用的运动轨迹。
模型架构
PhysDreamer通过生成运动中物体的可信视频,然后优化材料场E(x)以匹配合成运动。给定一个表示为3D高斯的对象,首先从某个视点进行渲染,然后使用图像到视频生成模型来生成运动中物体的参考视频。接着,使用可微分材质点方法(MPM)和可微分渲染,对空间变化的材质场和初始速度场进行优化,旨在最小化渲染视频和参考视频之间的差异。
实验结果
研究人员收集了八个真实世界的静态场景,并捕捉了四个交互视频来说明其在交互后的自然运动。在用户研究中,超过80%的参与者在两项选择实验中更倾向于PhysDreamer模型,认为其在运动的真实性上更胜一筹;在视觉质量方面,也有65%的参与者更偏好PhysDreamer。
PhysDreamer模型的发布,为解决视频生成中的物理交互问题提供了一种有效的解决方案。通过估计物体的物理材料属性,PhysDreamer能够合成更加逼真的物体动态行为,显著提升了视频生成的真实感。这一研究成果有望推动视频生成技术的发展,为未来的应用带来更多可能性。
Google 扩展测试计划将 Gmail 和 Docs 生成式 AI 带给 10 倍以上的受信任测试人员
三月下旬,Google开始让公众测试Gmail和Docs的生成式AI。现在,它正在大幅扩展「受信任的测试者」计划。今天,Google表示正在将生成式AI能力的「受信任的测试者」计划扩展「超过10倍」。该计划名为「GoogleWorkspace中的实验室」,目前仅适用于被邀请的美国英语测试者。站长网2023-05-05 20:48:230000华为发布乾崑智能汽车解决方案 包括乾崑智驾、乾崑车控等
华为2024智能汽车解决方案发布会盛大召开,全新品牌华为乾崑正式亮相,并携智能汽车解决方案惊艳登场。在备受瞩目的发布会上,华为宣布了其在智能汽车领域的重要进展。华为认为,2024年将标志着智能驾驶规模商用的新纪元,预计年底前将有50万辆汽车采用华为的智能驾驶技术。站长网2024-04-24 14:12:330000AI辅助语言学习应用Speak获得1600万美元融资
AI辅助语言学习应用Speak宣布获得1600万美元的B-2轮融资,由天使投资人LachyGroom领投。Dropbox的联合创始人DrewHouston和ArashFerdowsi也参与了这轮融资。Speak计划利用这笔资金在更多市场扩展,包括年底进军美国市场。站长网2023-09-01 16:49:490001ChatGPT新增聊天存档功能,可构建自己的聊天数据库啦!
12月21日,OpenAI在社交平台宣布,ChatGPT新增存档功能,用户可以保存聊天记录而不必删除它们。虽然这只是一个很小的功能,但对于科研、医疗、写作、金融、律师等,对文本使用频率较高的行业帮助巨大,可构建自己的文本资料数据库,并进行精细化管理。0000今天是iPhone15系列发售日 iPhone 15粉色首销成爆款
今天,iPhone15系列在手机市场引起了热烈的反响。全渠道销售一开启,就受到了广大消费者的热烈追捧。其中,新推出的粉色款iPhone15表现尤为亮眼,成为了京东手机热卖榜上的爆款产品。从预售到首销期间,粉色款iPhone15在京东平台持续热销,占据了4000-6000元手机排行榜的领先位置。此款手机的热销不仅展示了消费者对于苹果新款产品的热爱,也突显了以粉色为代表的女性化手机市场的巨大潜力。站长网2023-09-22 10:08:140000