谷歌提出生成式图像动力学:让静态图片动起来
站长网2023-09-18 10:30:490阅
谷歌团队最新提出「生成图像动力学」,这项研究提出了一种基于图像空间的场景动力学先验模型。该模型可以将单张静态图片转换成无缝循环视频,或者用于与图片中的对象进行交互。

项目地址:https://generative-dynamics.github.io/#demo
研究人员首先从包含自然振荡运动的真实视频中,如树叶摇曳、花朵飘动、蜡烛跳动和衣物飘扬等,提取运动轨迹。然后利用这些轨迹数据训练模型学习图像动力学的先验知识。对于任意输入图片,模型可以预测每个像素的长期运动表示,作者称之为神经随机运动纹理。这些表示随后转换为密集的运动轨迹,可生成整段视频。配合图像渲染模块,这些轨迹可以用于各种下游应用,如将静态图片转换成无缝循环视频,或者让用户可以与图片中的对象进行交互。
利用神经随机运动纹理,研究人员可以模拟对象对用户交互的响应。用户可以在图片中拖动一个点,然后释放手指,场景会根据点的位置和方向产生相应运动。用户还可以点击选择不同的图片进行交互。
通过调整运动纹理的振幅,研究人员可以放大或缩小物体的运动效果。他们还可以通过插值预测的运动纹理来生成慢动作视频。
该方法自动将单张静态图片转换成无缝循环视频,具有广阔的应用前景。它为创作更加逼真的数字内容提供了可能,如将电影片段的单帧转换为可交互的动态场景。该研究为基于单张图片合成视频开辟了新的思路。
特点:
(1)从视频中提取自然运动轨迹,训练获得图像动力学先验模型
(2)对静态图片预测像素级长期运动表示,即神经随机运动纹理
(3)将运动纹理转换为密集运动轨迹,合成动态视频
(4)支持用户与图片中的对象交互
(5)调整运动纹理振幅来控制运动效果
(6)通过插值产生慢动作视频
0000
评论列表
共(0)条相关推荐
街头假人骑三轮车载客,实现无人驾驶?网友:这画风让人瘆得慌
听说最近在街头上出现了一个超级酷炫的场景,假人居然骑着三轮车载着客人,还实现了无人驾驶?这是真的吗?网友们都被这种新奇的画风给瘆慌了!想象一下,当你走在路上,突然看到一个假人坐在三轮车上,满脸堆笑地载着人,而车子却完全是自动驾驶,没有人在控制!这种情景会让你感到非常震撼和紧张吧!站长网2023-05-23 20:51:060001AI 图像生成器市场规模预计将在2030年超过9亿美元,年复合增长率为17.4%
划重点:-AI图像生成器市场预计在2030年将达到917,448,000美元,年复合增长率为17.4%。-企业领域占据市场主导地位,原因是任务自动化和流程优化。-数字转型倡议的增加推动了市场增长。根据FortuneBusinessInsights的报告,全球AI图像生成器市场规模预计将在2030年达到917,448,000美元,年复合增长率为17.4%。站长网2023-11-22 16:35:410000AI几小时设计芯片超越人类!谷歌AlphaChip登Nature,已设计出三代旗舰TPU
【新智元导读】谷歌的AlphaChip,几小时内就能设计出芯片布局,直接碾压人类专家!这种超人芯片布局,已经应用在TPU、CPU在内的全球硬件中。人类设计芯片的方式,已被AI彻底改变。能设计芯片的AI黑科技来了!就在刚刚,谷歌DeepMind推出名为AlphaChip的AI系统。无论是设计最先进的用于构建AI模型的TPU,还是数据中心的CPU,它在相关的众多领域,都产生了广泛影响。站长网2024-09-30 20:58:440000好用的作图模型推荐:高质量动漫风格模型Counterfeit-V3.0
Counterfeit-V3.0是一个高质量的动漫风格模型。它通过生成逼真的动漫图像来满足用户的需求。Counterfeit-V3.0提供稳定的扩散检查点,并且支持通过Ko-fi进行捐赠。它是Civitai公司的产品,具有以下核心功能:1.高质量动漫风格生成:Counterfeit-V3.0使用先进的技术,生成具有逼真动漫风格的图像,为用户提供高质量的视觉体验。站长网2023-07-21 16:46:400000文本直接生成20多种背景音乐,免费版Stable Audio来了!
9月14日,著名开源平台StabilityAI在官网发布了,音频生成式AI产品StableAudio。(免费使用地址:https://www.stableaudio.com/generate)用户通过文本提示就能直接生成摇滚、爵士、电子、嘻哈、重金属、民谣、流行、朋克、乡村等20多种类型背景音乐。站长网2023-09-14 21:35:250000