登陆注册

UCLA

  • 懂3D的语言模型来了!UCLA、上交、MIT等联合提出3D-LLM:性能大涨9%

    【新智元导读】有了3D-语言模型,去重庆导航也不在「话」下!大型语言模型(LLM)和视觉语言模型(VLM)在各种评测基准中都展现出了强大的性能,比如可以看图说话、进行常识推理。但这些模型的训练过程并没有引入3D物理世界,也就无法理解更丰富的现实概念,包括空间关系、布局、物体反馈等。
    站长网2023-08-03 15:53:00
    0000