首页站长资讯Andrej Karpathy：神奇大模型不存在的，只是对人类标注的拙劣模仿

Andrej Karpathy：神奇大模型不存在的，只是对人类标注的拙劣模仿

站长网2024-12-02 20:00:010阅

也许是时候寻找新的方法了?

大模型回答人类的对话内容，究竟有多少「智能」成分在里面?

本周五，知名 AI 领域学者，OpenAI 创始成员、特斯拉前 AI 高级总监 Andrej Karpathy 发表观点:「人们对『向人工智能询问某件事』的解释过于夸张」，引发网友热议。

Karpathy 称:人工智能基本上是通过模仿人工标注数据来进行训练的语言模型。所以不要将对话视为「询问人工智能」的神秘主义，而应将其更多地视为「询问互联网上的平均数据标注者」。

例如，当你问「阿姆斯特丹十大景点」之类的问题时，一些受雇的数据标签员可能在某个时候看到了类似的问题，使用谷歌等软件研究了20分钟，列出了10个景点的列表，然后字面意思就变成了正确答案，训练人工智能给出该问题的答案。如果有问题的确切位置不在微调训练集中，神经网络会根据从预训练阶段（互联网文档的语言建模）获得的知识来进行估计。

当有网友评论称:「RLHF 可以创造超越人类的结果」，Karpathy 表示:「RLHF 仍然是来自人类反馈的 RL，所以我不会这么说」。

Karpathy 认为:RLHF 将模型性能从 SFT 的「人工生成」级别提升到「人工判别」级别。但这与其说是「原则上」，不如说是「实践上」，因为「判别」对于普通人来说比「生成」更容易（例如，判断这5首关于 X 的诗中哪一首最好，而不是写一首关于 X 的诗）。

另外，还可以从群体智慧效应中获得单独的提升，即 LLM 的性能不是达到人类水平，而是达到人类整体水平。因此，原则上，对于 RLHF，所能期望的最好结果就是达到专家水平。

所以从某种意义上来说，这算是「超人」，但 Karpathy 认为:要按照人们默认的方式成为真正的「超人」，要去 RL 而不是 RLHF。

其实，这已不是 Andrej Karpathy 第一次批判 RLHF 了。作为前 OpenAI 重要成员，他在今年8月就和 Yann LeCun 等人一起质疑过由 GPT 系列模型发扬光大的 RLHF 强化学习的意义。

「RLHF 只是勉强算强化学习。」

他当时使用 DeepMind 的 AlphaGo 作为例子。如果我们当时用 RLHF 的方法训练 AlphaGo 会是什么样子?可能会既无法构成有效的奖励，又会形成偏离正常轨道的优化，那就势必无法创造出「打败人类世界冠军」的历史了。

出于同样的原因，Karpathy 对 RLHF 竟然适用于 LLM 感到「有点惊讶」。因为我们为 LLM 训练的 RM（Reward Model）只是以完全相同的方式进行直觉检查。它会对人类标注者可能喜欢的判断给出高分，它不是正确解决问题的「实际」目标，而是人类认为好的替代目标。

其次，你甚至不能运行 RLHF 太长时间，因为你的模型很快就会学会适应游戏奖励模型，再推理出一些不正常的 Token。这在人类看来很荒谬，但出于某种原因 RM 会认为看起来很棒。

无独有偶，今年9月，一篇来自 VRAIN、剑桥大学研究人员的 Nature 论文对 o1-preview 等模型进行了评测，发现很多对于人类来说简单的任务，大模型却根本无法解决。而在一些复杂的任务上，LLM 也根本不知道「回避」，而是会装模作样的思考一通之后，给出一个错误的答案。

虽然随着时间的推移，大模型的参数体量越来越大，训练的数据也越来越多，性能也不断提升，但从基础机制的角度来说，它们似乎并不靠谱。

如果 RLHF 不管用，还能有什么样的奖励机制能帮助大模型「准确遵循指令」呢?

今年7月，OpenAI 就公布了一种教导 AI 模型遵守安全政策的新方法，称为基于规则的奖励（Rule-Based Rewards，RBR）。RBR 不仅限于安全训练，它们可以适应各种任务，其中明确的规则可以定义所需的行为，例如为特定应用程序定制模型响应的个性或格式。这或许为大模型下一步性能突破提供了新的思路。

参考内容:

https://x.com/karpathy/status/1821277264996352246

AndrejKarpathy神奇大模型不存在的只是对人类标注的拙劣模仿

0000

评论列表

共(0)条

相关推荐

站长资讯
这年头，还有游戏社交产品能融500万美金？
之前，我们在《热度仅次于Temu，2款音频App无视流量困境，野蛮增长》选题中，写过SLAY做的AI音频匿名社交产品frfr，在6天内获得50万次下载，也在美国下载总榜上停留了很长一段时间。之前，他们好像还做过互吹彩虹泡泡的匿名社交Gas的欧洲版本。总之，Slay以往的成绩都和匿名社交挂点关系。
站长网2024-07-09 15:52:18
0000
站长资讯
三大运营商SIM卡硬钱包上线数字人民币：手机断网、没电也能买买买
快科技7月11日消息，今日，中国移动联合中国工商银行，中国电信、中国联通联合中国银行推出的数字人民币SIM卡硬钱包，正式在数字人民币App上线。SIM卡硬钱包是将数字人民币App钱包关联至超级SIM卡，用户在商家进行付款时，无需扫码或者调出二维码，手机可在锁屏状态碰一碰商家POS机，即可轻松完成付款。目前只有具备NFC功能的安卓手机支持SIM卡硬钱包使用。
站长网2023-07-12 11:35:34
0002
余承东亲自爆料！华为Mate 70 Pro+正面揭晓：的三挖孔
科技界传来重磅消息华为高管近期展示了即将推出的Mate70Pro旗舰机正面外观。与前代一致，它延续了独特的“三挖孔”设计，保持了行业内独一无二的辨识度。屏幕方面，Mate70Pro采用等深曲率设计，四边等宽，带来视觉上的和谐感。系统升级，国产自研
站长网站长资讯2024-11-27 16:18:46
0000
站长资讯
代码托管平台 GitLab 推出 AI 驱动的排查代码漏洞功能
代码托管平台GitLab宣布推出一个新的安全功能，将使用人工智能(AI)向开发人员解释编码漏洞。该公司的目标是在未来利用大型语言模型(LLMs)自动化漏洞排查。
站长网2023-04-26 11:00:36
0000
站长资讯
ChatGPT开源替代品！Hugging Face的HuggingChat号称媲美GPT-3.5
目前，市面上已经有不少ChatGPT/GPT4开源替代品，想体验相关产品可访问《有哪些类似chatgpt产品?17个ChatGPT/GPT4开源替代品推荐（附网址）》一文了解。最近HuggingFace发布了开源聊天机器人HuggingChat，用户可以在浏览器中免费试用或根据自己需要进行自定义。
站长网2023-04-26 10:52:04
0002