登陆注册

根据自然语言指令生成动作和视频的通用世界模型

  • Pandora:根据自然语言指令生成动作和视频的通用世界模型

    划重点:🔍Pandora是一个通向通用世界模型(GWM)的重要步骤,通过生成视频来模拟任何领域的世界状态。🔍Pandora可以接受自然语言输入作为动作,并在视频生成过程中实时控制视频内容,与之前只能在视频开始时输入文本提示的文本到视频模型有着关键的不同。🔍Pandora还可以生成基于相同初始状态但不同动作的多个替代未来的视频,让用户能够自主控制未来的发展。
    站长网2024-05-24 21:12:07
    0000