登陆注册

斯坦福大学研究

  • 斯坦福大学研究:通过自动偏好排名和NLP进展,降低大语言模型错误率

    **划重点:**1.🚀斯坦福大学和UNCChapelHill的研究人员通过自动偏好排序和NLP进展解决了大语言模型(LLMs)产生的虚构性错误的问题。2.🔄采用新颖的方法,研究人员通过对LLMs进行微调,在无人工标记的情况下提高在开放式生成环境中的事实准确性。
    站长网2023-11-22 11:00:18
    0001
  • 斯坦福大学研究:强化学习智能体能间接学习语言技能

    斯坦福大学的研究团队在自然语言处理领域取得了突破性进展,探究了强化学习(RL)智能体是否能在没有明确语言监督的情况下间接学习语言技能。研究的主要焦点是探索强化学习智能体是否能够像通过与环境互动以实现非语言目标的方式学习语言技能。为了实现这一点,研究团队设计了一个办公室导航环境,要求智能体尽快找到目标办公室。论文地址:https://arxiv.org/abs/2306.08400
    站长网2023-08-04 09:55:02
    0001