文本生成高清、连贯视频,谷歌推出时空扩散模型
谷歌研究人员推出了创新性文本生成视频模型——Lumiere。
与传统模型不同的是,Lumiere采用了一种时空扩散(Space-time)U-Net架构,可以在单次推理中生成整个视频的所有时间段,能明显增强生成视频的动作连贯性,并大幅度提升时间的一致性。
此外,Lumiere为了解决空间超分辨率级联模块,在整个视频的内存需求过大的难题,使用了Multidiffusion方法,同时可以对生成的视频质量、连贯性进行优化。
论文地址:https://arxiv.org/abs/2401.12945?ref=maginative.com
时空扩散U-Net架构
传统的U-Net是一种常用于图像分割任务的卷积神经网络架构,其特点是具有对称的编码器-解码器,能够在多个层次上捕获上下文信息,并且能够精确地定位图像中的对象。
而时空扩散U-Net是在时空维度上执行下采样和上采样操作,以便在紧凑的时空表示中生成视频。
下采样的目的是减小特征图的尺寸,同时增加特征图的通道数,以捕捉更丰富的特征。
上采样则是通过插值以及将特征图的尺寸恢复到原始输入的大小,同时减少通道数,以生成更细节的输出。
时空扩散U-Net的编码器部分通过卷积和池化操作实现时空下采样。卷积层用于提取特征,并逐渐减小特征图的尺寸。
池化层则通过降采样操作减小特征图的空间尺寸,同时保留重要的特征信息。通过逐步堆叠这些下采样模块,编码器可以逐渐提取出更高级别的抽象特征。
因此,Lumiere在时空扩散U-Net架构帮助下,能够一次生成80帧、16帧/秒(相当于5秒钟)的视频。并且与传统方法相比,这种架构显著增强了生成视频运动的整体连贯性。
Multidiffusion优化方法
Multidiffusion核心技术是通过在时间窗口内进行空间超分辨率计算,并将结果整合为整个视频段的全局连贯解决方案。
具体来说,Multidiffusion通过将视频序列分割成多个时间窗口,每个时间窗口内进行空间超分辨率计算。
这样做的好处是,在每个时间窗口内进行计算可以减少内存需求,因为每个时间窗口的大小相对较小。同时,这种分割的方式也使得计算更加高效,并且能够更好地处理长视频序列。
在每个时间窗口内,Multidiffusion方法使用已经生成的低分辨率视频作为输入,通过空间超分辨率级联模块生成高分辨率的视频帧。
然后,通过引入扩散算法,将每个时间窗口的结果进行整合,形成整个视频段的全局连贯解决方案。
这种整合过程考虑了时间窗口之间的关联性,保证了视频生成的连贯性和视觉一致性。
肯德基和麦当劳的短剧,给品牌定制剧带来了新思考
万万想不到,有生之年我能看到肯德基与麦当劳拍摄的短剧。近日,肯德基的首部自制短剧《重生之吃货皇后惹不起》正式上线,作品围绕重生元素,与肯德基植入广告相结合,引发了广大网友的热议,当前抖音播放量超1.1亿。站长网2024-09-05 05:38:300000Anthropic预计年收入将达8.5亿美元,挑战OpenAI地位
**划重点:**1.📈AnthropicPBC计划于2024年底实现8.5亿美元年化收入,较三个月前的预测大幅增长。2.🤝Anthropic由Amazon和Google支持,旗下模型Claude2挑战ChatGPT,能处理高达10万令牌的复杂提示。3.💰公司正在进行额外的7.5亿美元融资轮,由MenloVentures主导,将使Anthropic的估值达到150亿美元。0000高德地图升级“防晒导航” 覆盖100个城市
高德地图近期宣布升级其"防晒导航"功能,增加了行中荫凉路段动态感知播报的功能。同时,该功能的覆盖城市从之前的22个扩展到了100个城市,涵盖了华南中东部、华东南部、西北地区北部以及内蒙古中西部等高温预警地区。自去年首次推出以来,高德地图的"防晒导航"已经为超过17亿人次提供了服务。站长网2023-07-12 17:37:040000东方甄选旅游式带货,一场卖了1亿元
旅游带货,东方甄选发现行业先机继知识带货之后,东方甄选又带火了一种带货方式:旅游式带货。4月15日至16日,东方甄选来到了浙江乌镇西栅景区,举办浙江好物专场活动,一边游山玩水一边直播带货,售卖浙江当地特产,如手剥笋、绍兴黄酒、嘉兴肉粽、宁波水磨年糕等。站长网2023-04-20 17:36:230001微信广告上线看一看焦点卡片广告 新增阅读人群触达场景
微信广告推出了新的功能——焦点卡片广告,可以触达更多阅读人群。据介绍,在微信的“发现”页面进入“看一看”后,“在看”页面将会展示品牌广告的置顶焦点图。此外,“看一看”场景的原生品牌内容集合落地页还能一站式展示品牌的视频号、公众号、小程序等内容。在沉浸式阅读的“看一看”场景下,用户可以高效获取品牌的重大事件资讯,了解品牌的故事和产品信息,并通过在看和分享来进行社交传播和扩散。站长网2023-06-29 11:40:010000