腾讯和香港科技大学开源视频生成模型VideoCrafter1 超越其他开源模型
站长网2023-11-01 11:35:020阅
腾讯和香港科技大学最近合作推出了一种全新的视频生成模型VideoCrafter,用于高质量视频生成。这个模型包括视频VAE和3D去噪U-net,经过在庞大的数据集上进行了训练,其性能表现出色,超过了其他开源视频生成模型。
该项目旨在创建一个高级且用户友好的视频生成模型,以满足研究和生产的需求,并为社区的发展做出贡献。他们还设想了一个视频创作助手,能够通过视觉创作将想象的点子变为现实。
项目地址:https://ailab-cvc.github.io/videocrafter/
VideoCrafter1提供了两种开放扩散模型,分别用于文本到视频(T2V)和图像到视频(I2V)任务。T2V模型能够生成具有1024×576分辨率的逼真且具有电影质量的视频,在质量方面胜过其他开源T2V模型。而I2V模型则旨在生成与提供的参考图像内容严格一致的视频,保留其内容、结构和风格。这是第一个能够将给定图像转化为视频剪辑并保持内容保存约束的开源I2V基础模型。
该项目的视频扩散模型框架利用自动编码器的潜在空间中训练视频UNet,以FPS作为条件来控制生成视频的运动速度。对于T2V模型,只需将文本提示通过交叉关注(feed into the spatial transformer)输入即可,而对于I2V模型,则将文本和图像提示一同输入。
此外,他们提供了EvalCrafter进行综合评估。项目鼓励使用其代码、模型和数据的研究引用,并采用Apache2.0许可分发其代码、模型和数据。
0000
评论列表
共(0)条相关推荐
蜜雪冰城回应放弃瓶装水业务:该项目已暂停代理
站长之家(ChinaZ.com)1月16日消息:据南方都市报报道,针对“蜜雪冰城暂停了瓶装饮料业务”的报道,蜜雪冰城负责瓶装业务的相关工作人员确认了产品调整的消息,表示目前蜜雪冰城的瓶装饮料项目已暂停代理。这一决定可能是由于市场表现不佳或战略调整等原因。站长网2024-01-16 11:03:160000百度百科App将下线 相关功能迁移至百度App“百度百科”小程序
近日,百度百科官方宣布,为进一步优化用户体验,其现有的App将于2024年6月30日正式下线,而相关功能将迁移至百度App中的“百度百科”小程序。随着App的下线,用户们将无需再下载或更新这款独立的App。相反,他们只需打开百度App,搜索“百度百科”小程序,即可享受同样丰富且更为全面的知识服务。站长网2024-04-23 15:53:530000AI应用商店是门好生意,可要如何说服开发者入驻?
无论EpicGames、Spotify这种一直与苹果对簿公堂,还是腾讯、抖音这样试图钻相关规则漏洞的公司,对于苹果通过应用内购买(IAP)抽取30%的费用,越来越多的头部开发者开始失去耐心。但就在抱怨“苹果税”的同时,有能力的厂商也在尝试复刻苹果建立的这一套体系。站长网2024-08-27 07:25:230000微博将推出 AIGC 创作助手:辅助大 V 进行内容创作
在日前的微博超级红人节上,微博宣布计划推出AIGC创作助手,帮助创作者提高内容质量和效率。微博将于二季度,针对历史累计原创博文大于5000条的创作者开放100个优先体验席位。此外,2023年微博将全面升级金V运营体系,将金V衡量标准从原来的流量考核,调整到「流量社交」的衡量,并升级对接服务能力,投入价值10亿元人民币的运营资源扶持金V群体扩大影响力。站长网2023-04-16 15:27:170001人机交互初创公司 Figure AI 正计划融资,微软和 OpenAI 或领投
据彭博社消息,知情人士透露专注于研发人机交互技术的初创公司FigureAIInc.正在进行融资谈判,计划在一轮融资中筹集至多5亿美元,由微软和OpenAI领投。图源备注:图片由AI生成,图片授权服务商Midjourney站长网2024-01-31 09:18:190000