登陆注册

开源视频字幕模型Video

  • 最长处理2小时,开源视频字幕模型Video ReCap

    随着抖音、快手等平台的火爆出圈,越来越多的用户开始制作大量的短视频内容。但对这些视频进行有效的理解和分析仍面临一些困难。尤其是视频时长超过几分钟、甚至几小时,传统的视频字幕生成技术往往无法满足需求。因此,北卡罗来纳大学和MetaAI的研究人员开源了,视频字幕模型VideoReCap。这是一种递归视频字幕生成模型,能够处理从1秒到2小时的视频,并在多个层级上输出视频字幕。
    站长网2024-02-28 09:10:59
    0001