阿里图像生成视频模型I2VGen-XL代码发布
站长网2023-12-15 11:11:403阅
阿里在11月份发布了论文,宣布将开源I2VGen-XL图像生成视频模型。如今,他们终于发布了具体的代码和模型。这一模型可以生成没有大幅人物动作的视频演示。
I2VGen-XL模型分为两个阶段。首先是基础阶段,该阶段通过使用两个分层编码器来保证连贯的语义,并保留输入图像的内容。其次是优化阶段,该阶段通过整合额外的简短文本来增强视频的细节,并将分辨率提高到1280x720。
代码地址:https://github.com/damo-vilab/i2vgen-xl
为了优化模型,研究团队收集了约3500万个单镜头文本视频对和60亿个文本图像对。通过这些数据,I2VGen-XL模型可以提高生成视频的语义准确性、细节的连续性和清晰度。
0003
评论列表
共(0)条相关推荐
天猫精灵大模型开放内测 Sound系列用户可优先体验
今日是天猫精灵6周年。天猫精灵表示,即日起至7月10日,通过天猫精灵App首页Banner或点击首页搜索入口进入“精灵大模型开放内测”页面申请报名,即可体验升级后更聪明、更懂你、更灵性、更愉悦的天猫精灵需要注意的是,目前,仅有Sound系列用户优先开放大模型内测体验资格,Sound系列升级到精灵大模型版本后“就近唤醒”暂不可用。儿童模式、精灵音色在参与内测设备上暂停使用,其他设备不受影响。站长网2023-07-05 19:25:510002特斯拉新款Roadster跑车年底亮相 马斯克:加速时间不到1秒
特斯拉创始人埃隆·马斯克今日在X平台上发布了一系列关于特斯拉第二代Roadster跑车的帖子,引发广泛关注。他自豪地宣布,新款Roadster跑车的设计目标已大幅提升,有望成为有史以来最令人兴奋的产品。马斯克在帖子中透露,特斯拉Roadster的生产计划已经完成,预计将在年底正式推出,并计划明年开始发货。他强调,这款跑车不仅在设计上有所突破,更在性能上达到了前所未有的高度。站长网2024-02-28 16:10:300000英伟达发布第三季度财报:AI需求推动收入增长 营收超181亿美元
英伟达发布最新财报,业绩再次超越市场预期,英伟达在第三季度实现了181.2亿美元的营收,同比增长高达206%,远超市场预计的160.9亿美元。公司的毛利率为75%,同比提升了18.9个百分点。AI需求持续推动英伟达的收入增长。公司的数据中心业务收入,包括AI显卡在内,保持了翻倍增长的势头,并不断刷新单季最高收入纪录。此外,游戏业务的收入增速也远超预期。站长网2023-11-22 09:21:460000邢波团队提出全开源倡议LLM360 让大模型实现真正的透明
要点:LLM360是邢波团队提出的全方位开源倡议,旨在使大型语言模型的训练过程真正透明,包括训练数据、代码、模型检查点和性能指标等全方位开放。LLM360的框架包括训练数据集与处理代码、训练代码与配置、模型检查点以及性能指标,提供了标准以确保更好地在社区中流通与共享,推动人工智能领域的开放合作研究。站长网2023-12-13 22:00:380000网易有道新增多项AI业务
天眼查App显示,网易有道信息技术(北京)有限公司发生工商变更,经营范围新增教学用模型及教具销售、人工智能硬件销售、人工智能通用应用系统、人工智能公共数据平台、人工智能基础软件开发、可穿戴智能设备制造、建筑智能化系统设计、住宅室内装饰装修等。该公司成立于2006年3月,法定代表人为周枫,董事长为丁磊,公司注册资本1.052亿美元,由有道(香港)有限公司全资持股。站长网2023-08-24 11:44:080000