OpenAI新研究:让小模型来监督大模型能显著提高泛化性能
要点:
创新方向:研究如何通过深度学习的泛化性质来以弱监督控制强模型,解决超智能对齐问题。
研究背景:超智能对齐的核心挑战是人类需要监督比他们更聪明的AI系统,提出通过小模型监督大模型的方法,取得了令人满意的初步结果。
研究结果:通过以GPT-2级模型作为弱监督者对GPT-4进行微调,能够在自然语言处理任务中显著提高泛化性能,表明了弱到强泛化的可行性,为未来AI对齐问题提供了新的研究方向。
人工智能的超级对齐问题在未来AI系统超越人类智能的情境下变得尤为复杂。研究小模型是否能够有效监督大模型成为关键问题。当前的对齐方法主要依赖于人类监督,但超级AI的复杂和创造性行为使得人类难以可靠监督。
为了解决这个核心挑战,研究提出一个创新的思路:能否用一个相对较弱的模型来监督一个更强大的模型。这种思路直观上可能让人觉得强大的模型会模仿弱监督者的错误,然而,研究发现,通过一种简单的方法,能够显著改善模型在多个领域的泛化性能。
文章地址:https://openai.com/research/weak-to-strong-generalization
研究采用了GPT-2级别的模型作为弱监督者,对GPT-4进行微调,取得了令人瞩目的效果。通过鼓励强模型更加自信,甚至在需要时与弱监督者有所不同意,研究展示了在自然语言处理任务中,能够以较弱的监督实现接近GPT-3.5级别性能的模型。
这种方法不仅是概念上的证明,同时也揭示了一些重要的局限性,如在ChatGPT的偏好数据上仍然存在问题。
研究结果表明,传统的人类监督方法在超级AI模型上可能不够可行,但弱到强泛化的方法却有望显著提高模型的性能。
虽然实验设置与实际对齐超级AI的问题存在差异,但这种方法为今天在这个问题上取得实证性进展提供了一种新的方向。未来的研究机会包括修复实验设置中的差异,开发更好可扩展的方法,并推进对弱到强泛化何时以及如何能够有效的科学理解。
对于机器学习研究社区而言,这是一个激动人心的机会,为超级AI对齐问题提供了实际进展的可能性。为了推动更多的研究,研究团队提供了开源代码,使得进行弱到强泛化实验变得更加容易,并启动了一项1000万美元的资助计划,鼓励研究生、学者和其他研究人员在超级AI对齐领域进行研究。
在当前背景下,解决如何使未来的超级AI系统安全对齐的问题变得比以往任何时候都更加重要,而现在我们有了更便捷的方式来取得实证性进展。期待研究者在这一领域取得更多的突破。
清华开源图文对话模型!表情包解读有一手,奇怪的benchmark增加了
丰色萧箫发自凹非寺量子位|公众号QbitAI什么,最懂表情包的中文开源大模型出现了??!就在最近,来自清华的一个叫VisualGLM-6B的大模型在网上传开了来,起因是网友们发现,它连表情包似乎都能解读!像这个腊肠犬版蒙娜丽莎,它不仅准确理解了这是腊肠犬与蒙娜丽莎的“合体照”,还点出了这只是一幅虚构作品:又像是这个正在出租车后熨衣斗的男子,它也一眼看出了“不对劲”的地方:站长网2023-05-24 17:08:380002头发变白 | 科学家揭秘逆转法 | 你还在染发吗?
你是否曾经为自己的头发变白而感到苦恼?你是否曾经为自己的外貌而失去自信?你是否曾经想过,如果能够让自己的头发恢复原来的颜色,那该多好?如果你有这样的想法,那么你一定要听听这个消息。一项新的研究发现,头发变白的过程不是不可避免和永久的,而是可以被逆转的!是的,你没有听错,你的白发可以重新变成黑色或其他颜色!这是怎么做到的呢?让我们一起来看看这项惊人的研究吧!站长网2023-05-23 15:44:000001老外的尴尬和狼狈里,藏着中国入境游的商机
6月末的一个工作日,北京城正在低气压中忍耐暴雨来临前最后的酷热。中午11点,王府井大街的阳光下几乎看不到什么行人,强烈的光线把游客赶进路两侧的冷饮或特产店,偶尔,会有结伴的外国游客成群出现。最近几月,中国一二线城市的外国游客浓度明显升高了。他们很好辨认:穿紧身速干运动装或吊带背心,很少穿防晒衣,最多戴黑色遮阳镜,不怕晒,喜欢走在大路中央,东张西望。站长网2024-07-06 16:15:010000Meta 停止在欧盟 Facebook、Instagram 帖子上训练人工智能的计划
站长之家(ChinaZ.com)6月16日消息:Meta原计划于6月26日开始在Facebook和Instagram上使用用户帖子进行AI训练。然而,Meta已经暂停了这一计划,原计划是通过处理大量用户数据,为欧洲带来新的AI体验。站长网2024-06-17 04:50:160000索尼同意与微软达成为期10年的使命召唤协议
据theverge报道,索尼已经同意与微软签订一份为期10年的《使命召唤》协议,以在微软收购动视暴雪后将该系列保留在PlayStation上。微软游戏首席执行官PhilSpencer表示,索尼和微软已经达成了一项“有约束力的协议”,以将《使命召唤》保留在PlayStation上。站长网2023-07-17 23:38:090000