登陆注册

一个视频中长期行为预测大型语言模型

  • AntGPT:一个视频中长期行为预测大型语言模型

    AntGPT是一个将大型语言模型应用于视频长期行为预测(LTA)的视觉语言框架。研究人员通过使用监督动作识别算法识别人类活动,并将其作为离散化的视频表示输入给OpenAIGPT模型。通过自回归方法、微调或上下文学习,GPT模型可以预测未来的行动序列,从而实现从底向上的行动预测。项目地址:https://brown-palm.github.io/AntGPT/
    站长网2023-08-07 10:38:22
    0000