阿里图像生成视频模型I2VGen-XL代码发布
站长网2023-12-15 11:11:403阅
阿里在11月份发布了论文,宣布将开源I2VGen-XL图像生成视频模型。如今,他们终于发布了具体的代码和模型。这一模型可以生成没有大幅人物动作的视频演示。
I2VGen-XL模型分为两个阶段。首先是基础阶段,该阶段通过使用两个分层编码器来保证连贯的语义,并保留输入图像的内容。其次是优化阶段,该阶段通过整合额外的简短文本来增强视频的细节,并将分辨率提高到1280x720。
代码地址:https://github.com/damo-vilab/i2vgen-xl
为了优化模型,研究团队收集了约3500万个单镜头文本视频对和60亿个文本图像对。通过这些数据,I2VGen-XL模型可以提高生成视频的语义准确性、细节的连续性和清晰度。
0003
评论列表
共(0)条相关推荐
谷歌、康奈尔提出真实的图像补全技术RealFill
要点:1.谷歌和康奈尔提出的RealFill技术能使用少量参考图像实现真实的图像补全,保持场景的一致性和真实性。2.RealFill通过微调预训练的模型,并使用标准的扩散采样来填充目标图像的缺失区域,同时处理不同视角和光照条件。3.实验结果显示RealFill在场景保真度和与参考图像的一致性方面表现出色,相比其他方法更具优势。站长网2023-10-02 10:18:100000妙鸭相机项目人事变动引关注 产品保持正常运营
据媒体报道,针对妙鸭相机产品负责人的人事变动,相关人士于11月14日回应称,项目本身照常进行。妙鸭相机,作为阿里旗下的AIGC(人工智能生成内容)类人像写真产品,曾在8月初一度在应用产品榜单上取得显著成绩。近期,妙鸭相机不仅与天猫、优酷等平台合作推出新模板,还上线了发型设计功能。尽管在应用榜单上的排名尚未回到巅峰水平,但项目方表示对产品的发展保持乐观态度。站长网2023-11-15 18:05:470000中年妈妈们的互联网生活,沉默而多彩
提起互联网,大家总会默认,这是年轻人的世界。年轻的媒介、年轻的使用者、年轻的语言,制造年轻的文化和潮流,一切顺理成章。平台关心年轻用户的喜好,因为他们是活跃且购买力强劲的人群;媒体关心年轻人的生活动向,追踪着“这届年轻人”又如何如何了。站长网2023-05-14 09:34:560000GPT-5正秘密训练!DeepMind联创爆料,这模型比GPT-4大100倍
【新智元导读】GPT-5仍在秘密训练中!DeepMind联合创始人在近日采访中透露,未来3年,Inflection模型要比现在的GPT-4大1000倍。近来,DeepMind联合创始人MustafaSuleyman,现InflectionAI的CEO,在采访时投出了重磅炸弹:OpenAI正在秘密训练GPT-5。我认为我们都直截了当地说会更好。这就是为什么我们披露了拥有的计算总量。站长网2023-09-04 09:20:4800002023,风起男频
无论是长剧、动漫、游戏,还是短剧和互动游戏,都需要有丰富的IP池为内容开发提供原点,满足市场不断提升的题材深度、类型创新性的要求。同时,AI技术对内容制作门槛的降低,让内容创作向轻量化,对IP的需求也会进一步提升。站长网2023-11-21 18:14:550000