登陆注册

阿里推I2VGen

  • 阿里推I2VGen-XL模型 双阶方法实现更高清的文本视频生成

    在视频合成领域,尽管扩散模型的迅速发展带来了显著的进步,但语义准确性、清晰度和时空连续性仍然是关键挑战。这些问题根源于缺乏良好对齐的文本-视频数据以及视频复杂结构的挑战。为解决这些问题,阿里巴巴提出了I2VGen-XL方法,通过创新性的两阶段级联扩散模型,有效分离了语义和质量,同时通过静态图像的引导实现了数据的对齐。项目地址:https://i2vgen-xl.github.io/
    站长网2023-11-13 21:44:48
    0000