视频版ControlNet开源 CoDeF靠提示词就能精准切换画风

站长网2023-08-21 09:29:352阅

最新视频处理算法 CoDeF 发布不久就引起网友热议，它能将原视频改变画风但保持其他细节不变。该算法由全华人团队开发，已在 GitHub 上开源。

CoDeF 能根据提示词精准控制视频元素改变，比如将风景纪录片秒变为国风水墨大作。它还能跟踪水流动向和穗子摆动频率，细节处理使效果更逼真。此外，CoDeF 也可以让电影角色一键变老，将皱纹添加到脸上而其他细节不受影响。

CoDeF 是一种创新的视频处理方法，通过规范内容场和时间变形场的优化，实现视频重构和各种图像算法在视频上的应用扩展，该算法能够实现更加真实时、强细节、高保真的视频重建。与现有的视频处理方法相比，CoDeF 具有更好的跨帧一致性，并能够处理非刚性物体。

论文地址:

https://arxiv.org/abs/2308.07926

项目地址:

https://qiuyu96.github.io/CoDeF/

该方法通过粒度逐步细化的训练过程，平衡了规范图像的自然性和重建的还原性。实验结果表明，该方法的重建质量显著提高，PSNR 增加了约4.4，规范图像的自然性也有明显改善。

此外，该方法还可以应用于视频超分辨率、视频对象分割、视频关键点跟踪等图像算法的任务，并保持卓越的时间一致性。总的来说，该视频重建算法具有较强的性能，展示了其在视频处理领域的潜力。

特点:

1. CoDeF 是一种全新的视频表示方法，由一个规范内容场和一个时间变形场组成。

2. 规范内容场聚合整个视频中的静态内容，时间变形场记录了从规范图像到每个单独帧的变形过程。

3. 可以通过优化这两个场来重构目标视频，通过精心设计的渲染流程实现。

4. 引入了一些正则化方法，使规范内容场从视频中继承语义信息（例如物体形状）。

5. CoDeF 支持将图像算法应用于视频处理，只需将算法应用于规范图像，再借助时间变形场将结果传播到整个视频中。

6. CoDeF 能够将图像到图像的转换扩展到视频到视频的转换，以及将关键点检测扩展到关键点跟踪，无需任何训练。

7. 通过在只有一张图像上应用算法的扩展策略，CoDeF 在处理的视频中实现了更好的跨帧一致性，甚至可以跟踪非刚性物体如水和烟雾。

视频版ControlNet开源CoDeF靠提示词就能精准切换画风

0002

评论列表

共(0)条

相关推荐

站长资讯
用MEG重构人类大脑成像过程，Meta发布重磅研究！
全球社交、科技巨头Meta（Facebook、Instagram等母公司）在官网公布了一项重磅研究，通过MEG(脑磁图)开发了一种AI模型用于解码人类大脑中视觉活动的成像过程，并公布了论文。据悉，这是一种每秒可进行数千次大脑活动侦测的，非侵入式神经成像技术，可实时重构出大脑在每一刻感知和处理的图像。可为科学界理解大脑如何表达、形成图像，提供了重要研究基础。
站长网2023-10-26 09:08:15
00023
站长资讯
AI率先解放了情感咨询的生产力
“怀孕六个月，我老公跟前妻一起带他们的孩子出去玩，三个人只开了一个标间。我老公说什么都没发生，但我还是觉得很崩溃，跟他大吵了一架，在家里抱怨了一通，把我婆婆气到住院了。我老公骂了我一顿，把我拉黑，半个多月没回家，生活费也不打，要怎么办?”这是硬糖君在某社交媒体刷到的真实热帖。将其抛给情感领域的从业者，我得到三个答案。
站长网2024-03-04 19:15:25
0000
站长资讯
谷歌 I/O 2023 重点是 AI：Android 14 在主题演讲中仅被提及一次
谷歌I/O2023有一个非常明确的重点——人工智能。SundarPichai对AI的介绍包括有关PaLM2，Google相册中的新「魔术编辑器」等的公告。GoogleBard也有扩展，并在GoogleWorkspace产品（Docs，Gmail等）和搜索中预览生成AI。
站长网2023-05-15 16:01:39
0001
司机都下岗的节奏！黄仁勋：未来汽车将全自动驾驶
快科技1月11日消息，对于司机这个岗位来说，以后可能都有没有必要存在了。英伟达CEO黄仁勋在CES展会上表示，到20年后所有汽车都将具备自动驾驶功能。特别是下一代纯电动汽车(EV)将全部成为自动驾驶汽车”，作为理由列举了人工智能(AI)和传感器技术的进步。他认为乘车人可以自己选择，也可以选择自己开车”。黄仁勋说。
站长网站长资讯2025-01-11 10:28:57
0000
站长资讯
OpenAI开源全新解码器，极大提升Stable Diffusion性能
在11月7日OpenAI的首届开发者大会上，除了推出一系列重磅产品之外，还开源了两款产品，全新解码器ConsistencyDecoder（一致性解码器）和最新语音识别模型Whisperv3。
站长网2023-11-08 09:11:55
0000