解决Sora物理bug!四所美国顶尖高校联合发布PhysDreamer模型
Sora视频生成器发布后不久,就被网友发现存在物理交互的bug,例如模型对物理世界的理解不足,导致小狗走路时前腿出现不自然的交错问题。为了解决这一问题,提升视频生成的真实感,来自MIT、斯坦福大学、哥伦比亚大学和康奈尔大学的研究人员联合提出了一种基于物理的方法模型——PhysDreamer。

项目地址:https://top.aibase.com/tool/physdreamer
论文链接:https://arxiv.org/pdf/2404.13026.pdf
PhysDreamer利用视频生成模型学习到的对象动力学先验,为静态3D对象赋予交互式动力学。通过提炼这些先验知识,PhysDreamer能够合成现实物体对全新交互的响应,如外力或智能体操作,并在弹性物体的不同示例上展现了该方法的效果。
问题形式化
PhysDreamer的目标是估计对象的物理材料属性场,以实现真实的交互式运动合成。具体来说,就是估计3D物体的空间变化杨氏模量场E(x),以进行粒子模拟。杨氏模量用来测量材料的刚度,决定物体响应外力作用的运动轨迹。
模型架构
PhysDreamer通过生成运动中物体的可信视频,然后优化材料场E(x)以匹配合成运动。给定一个表示为3D高斯的对象,首先从某个视点进行渲染,然后使用图像到视频生成模型来生成运动中物体的参考视频。接着,使用可微分材质点方法(MPM)和可微分渲染,对空间变化的材质场和初始速度场进行优化,旨在最小化渲染视频和参考视频之间的差异。
实验结果
研究人员收集了八个真实世界的静态场景,并捕捉了四个交互视频来说明其在交互后的自然运动。在用户研究中,超过80%的参与者在两项选择实验中更倾向于PhysDreamer模型,认为其在运动的真实性上更胜一筹;在视觉质量方面,也有65%的参与者更偏好PhysDreamer。
PhysDreamer模型的发布,为解决视频生成中的物理交互问题提供了一种有效的解决方案。通过估计物体的物理材料属性,PhysDreamer能够合成更加逼真的物体动态行为,显著提升了视频生成的真实感。这一研究成果有望推动视频生成技术的发展,为未来的应用带来更多可能性。
聊聊小红书直播带货、社交价值和设计师品牌
本期我们聊的话题涉及小红书电商、中国原创设计师品牌的代际更迭,以及为什么消费品牌要从流量品牌过度到商业品牌。对谈嘉宾是小红书博主Moni,Moni过往的职业分别涉及高端生活方式杂志、奢侈品公司LVMH、连卡佛·载思集团,始终围绕内容、时尚、买手、品牌等等几个关键词。目前她在广州筹备自己的品牌,会帮一些品牌做咨询顾问,也在小红书做直播带货,还在跟其中一些品牌尝试联名合作,探索直播带货新方向。0000老匡:2025视频号9大机会点!每一个都会在明年实现!
看“趋势”和“机会点”这个东西,你不要过分迷信数据,你出去做调研,用户永远告诉你“他们需要既便宜又好的产品”,所以数据只能告诉你正确的废话,意义不大。正确的做法是大量调研,得出感性谈判,再去用数据求证真伪,最后得出结论。真正的需求,往往是感性判断,而非理性得出,例如苹果手机,在没这个玩意儿之前,靠调研和数据,你永远不知道大家对手机的需求是怎样的。0000社交平台人人网已停止服务:目前已无法登录
老牌社交平台人人网目前已无法登录,用户尝试登录时会收到账号密码错误的提示。尽管人人网的登录页面尚可访问,但注册账号和找回密码的选项已经消失。人人网最初以校内网的身份在2005年成立,由陈一舟等人创立,主要服务于大学生群体。2009年,校内网更名为人人网,标志着其服务范围的扩大,开始向更广泛的用户群体开放。0000预测超长蛋白质这事,CPU赢了
AI模型的推理在CPU上完成加速和优化,竟然不输传统方案?至少在生命科学和医疗制药方向,已经透露出这种信号。例如在处理AlphaFold2这类大型模型这件事上,大众普遍的认知可能就是堆GPU来进行大规模计算。但其实从去年开始,CPU便开始苦练内功,使端到端的通量足足提升到了原来的23.11倍。而现如今,CPU让这个数值greatagain——再次提升3.02倍!站长网2023-07-02 18:04:300000关于抖音电商,还有哪些增量可以拿?
不到三年时间,抖音电商不断发展。2020年,以罗永浩为代表的名人明星掀起直播带货热潮。内容电商随之破圈,成为同年618、双11的新生力量。2021年,抖音电商正式提出“兴趣电商”定位,次年又再升级为“全域兴趣电商”,“货找人”和“人找货”双向覆盖。而当内容和货架结合,一系列新变量又带来了新机会。站长网2023-05-18 14:02:200001