谷歌提出生成式图像动力学:让静态图片动起来
站长网2023-09-18 10:30:490阅
谷歌团队最新提出「生成图像动力学」,这项研究提出了一种基于图像空间的场景动力学先验模型。该模型可以将单张静态图片转换成无缝循环视频,或者用于与图片中的对象进行交互。
项目地址:https://generative-dynamics.github.io/#demo
研究人员首先从包含自然振荡运动的真实视频中,如树叶摇曳、花朵飘动、蜡烛跳动和衣物飘扬等,提取运动轨迹。然后利用这些轨迹数据训练模型学习图像动力学的先验知识。对于任意输入图片,模型可以预测每个像素的长期运动表示,作者称之为神经随机运动纹理。这些表示随后转换为密集的运动轨迹,可生成整段视频。配合图像渲染模块,这些轨迹可以用于各种下游应用,如将静态图片转换成无缝循环视频,或者让用户可以与图片中的对象进行交互。
利用神经随机运动纹理,研究人员可以模拟对象对用户交互的响应。用户可以在图片中拖动一个点,然后释放手指,场景会根据点的位置和方向产生相应运动。用户还可以点击选择不同的图片进行交互。
通过调整运动纹理的振幅,研究人员可以放大或缩小物体的运动效果。他们还可以通过插值预测的运动纹理来生成慢动作视频。
该方法自动将单张静态图片转换成无缝循环视频,具有广阔的应用前景。它为创作更加逼真的数字内容提供了可能,如将电影片段的单帧转换为可交互的动态场景。该研究为基于单张图片合成视频开辟了新的思路。
特点:
(1)从视频中提取自然运动轨迹,训练获得图像动力学先验模型
(2)对静态图片预测像素级长期运动表示,即神经随机运动纹理
(3)将运动纹理转换为密集运动轨迹,合成动态视频
(4)支持用户与图片中的对象交互
(5)调整运动纹理振幅来控制运动效果
(6)通过插值产生慢动作视频
0000
评论列表
共(0)条相关推荐
上海:支持中小企业购买人工智能算力等服务
今日,上海市服务企业联席会议办公室印发了《上海市助力中小微企业稳增长调结构强能力若干措施》的通知。通知提出,加大数字能力供给。支持中小企业使用线上会议软件、工业软件等“小快轻准”数字化解决方案和产品。实施智评券、算力券等,支持中小企业购买智能工厂诊断咨询及人工智能算力等服务。站长网2023-05-17 14:30:440000靠一张AI图卖出上千件?这届网友被国风毛衣裙骗惨了
国风毛衣裙的“受害者”还在持续增加。卖家秀是新中式设计,毛衣质感柔软又飘逸,模特仿佛是仙气飘飘的大小姐,结果买家秀却成了大小姐的粗使丫头,颜色、版型、材质等都跟图片效果差太多。最近话题“国风毛衣裙的第一批受害者”登上了各大平台热搜,微博话题阅读量超3404万,抖音“国风毛衣”话题下的视频播放量达1.3亿。站长网2023-10-09 22:48:590000谷歌拟在 5 年内完成AI芯片自主研发 放弃博通供应
据国外媒体报道,知情人士透露,谷歌计划最早在2027年放弃芯片供应商博通,转为自主研发AI服务器芯片。今年早些时候,谷歌与博通就芯片定价问题未达成一致,导致谷歌做出放弃博通的决定。消息传出后,业内对谷歌的此举给予广泛关注。分析认为,自主设计TPU芯片有助谷歌每年节省数十亿美元成本。目前,谷歌正在大力投入AI技术研发,其中芯片研发成本Especially高。放弃博通供应,有助降低成本支出。站长网2023-09-22 11:14:320000信也科技推出第一代大语言模型应用开发框架E-LADF
近日,信也科技推出第一代LLM(大语言模型)应用开发框架E-LADF。E-LADF以类ChatGPT大模型引擎、向量数据库等基础组件为底座,旨在提供一系列功能接口,帮助开发者构建和部署基于LLM的应用程序。目前,E-LADF包含四大核心接口功能:本地知识库管理、通用场景流式对话、基于本地知识库的问答和长文本实体抽取与摘要。站长网2023-07-15 11:18:530001苹果下调自研车自动驾驶目标 推迟自研车上市时间
1月24日,据外媒报道,苹果公司的汽车开发项目遭遇挫折,导致该款汽车的发布日期较原计划推迟了两年。自2014年启动以来,苹果的“泰坦项目”经历了一系列重组、裁员、领导层变动和战略调整。尽管每年投入高达10亿美元,但目前该项目仍未进入正式的原型阶段。站长网2024-01-24 14:00:100000