谷歌提出生成式图像动力学:让静态图片动起来
站长网2023-09-18 10:30:490阅
谷歌团队最新提出「生成图像动力学」,这项研究提出了一种基于图像空间的场景动力学先验模型。该模型可以将单张静态图片转换成无缝循环视频,或者用于与图片中的对象进行交互。

项目地址:https://generative-dynamics.github.io/#demo
研究人员首先从包含自然振荡运动的真实视频中,如树叶摇曳、花朵飘动、蜡烛跳动和衣物飘扬等,提取运动轨迹。然后利用这些轨迹数据训练模型学习图像动力学的先验知识。对于任意输入图片,模型可以预测每个像素的长期运动表示,作者称之为神经随机运动纹理。这些表示随后转换为密集的运动轨迹,可生成整段视频。配合图像渲染模块,这些轨迹可以用于各种下游应用,如将静态图片转换成无缝循环视频,或者让用户可以与图片中的对象进行交互。
利用神经随机运动纹理,研究人员可以模拟对象对用户交互的响应。用户可以在图片中拖动一个点,然后释放手指,场景会根据点的位置和方向产生相应运动。用户还可以点击选择不同的图片进行交互。
通过调整运动纹理的振幅,研究人员可以放大或缩小物体的运动效果。他们还可以通过插值预测的运动纹理来生成慢动作视频。
该方法自动将单张静态图片转换成无缝循环视频,具有广阔的应用前景。它为创作更加逼真的数字内容提供了可能,如将电影片段的单帧转换为可交互的动态场景。该研究为基于单张图片合成视频开辟了新的思路。
特点:
(1)从视频中提取自然运动轨迹,训练获得图像动力学先验模型
(2)对静态图片预测像素级长期运动表示,即神经随机运动纹理
(3)将运动纹理转换为密集运动轨迹,合成动态视频
(4)支持用户与图片中的对象交互
(5)调整运动纹理振幅来控制运动效果
(6)通过插值产生慢动作视频
0000
评论列表
共(0)条相关推荐
美图自研AI视觉大模型MiracleVision奇想智能3.0版发布
美图公司在其15周年生日会上发布了自研AI视觉大模型MiracleVision(奇想智能)3.0版本,并将全面应用于旗下的影像与设计产品。这一大模型将助力电商、广告、游戏、动漫、影视五大行业,提高工作流效率。站长网2023-10-09 14:57:130000韩国 2025 年起将 AI 引入中小学课程 解决教育不平等问题
韩国教育部日前表示,为满足对多样化学习内容日益增长的需求,将从2025年开始在中小学引入人工智能(AI)数字教科书。站长网2023-06-12 03:42:430000比蜜雪冰城还“牛掰”的生意,熬不过这个冬天?
“老板很忙,想喝啥自己拿!”今年夏天开始,在城市街头巷尾,一台台无人看管的冰柜装着各式糖水,配着“5元一杯”的大字如雨后春笋出现,吸引路人驻足。“除了店租和首批物料,不到6万元就能开店,毛利在63%。”某自助糖水铺品牌的招商人员表示,有投资者不到一个月就能回本。社交平台上,一位自助糖水铺的创始人直言线下数据比蜜雪冰城还“牛掰”。站长网2023-11-30 14:10:050002看样子,淘宝正在全力借力微信
2024注定是不平凡的一年。就在刚刚,淘宝部分打通了微信支付功能,阿里腾讯再次握手互通,意义深远。见实第一时间向淘宝官方求证,平台对此表示:“微信支付是淘宝推出且在逐步开放的通过微信支付淘宝订单的服务,订单是否使用微信支付,以支付页面显示为准。微信支付目前仅针对部分用户逐步开放,且仅支持部分商品时可选择。”站长网2024-02-21 09:01:250000最高便宜1600元!iPhone16官旗多款机型破发
在2024年的双11购物节期间,苹果公司对发布仅一个月的iPhone16系列进行了官方降价,这标志着自新机发布以来在官方渠道的首次价格下调。0000