OpenAI科学家震惊TED大会:让AI模型思考20秒,提升10万倍性能!
今天凌晨,知名科技媒体Venturebeat消息,OpenAI高级研究科学家、德扑AI之父Noam Brown,在美国旧金山举办的TED AI大会上提出了一个震惊的理论——让AI模型思考20秒所带来的性能提升,相当于将模型扩大100,000倍并训练100,000倍的时间。
最初,Brown也被这个结果吓到了,还写了多篇论文来验证其真实性。他发现“系统二思维”(System2thinking)才是让AI模型性能大幅度提升的关键所在。而OpenAI最新发布的o1模型同样引入了这个技术概念,并且获得了非常出色的性能提升。
Brown在演讲中表示,过去5年AI能获得巨大提升可以用一个词来概括——规模。但如今的前沿AI模型仍基于2017年推出的Transformer架构,主要区别在于数据规模和计算能力。
现在是时候进行训练、推理范式转变了,AI模型需要超越单纯的数据预处理,进入 “系统二思维”模式,以一种更慢、更审慎的拟人化推理形式来解决超复杂的难题。
系统二思维介绍
“系统二思维”是一个心理学概念,描述了人类处理复杂问题时所采用的深度思考方式。这个概念最初由心理学家Daniel Kahneman在他的著作《思考,快与慢》中提出,用来解释人类大脑的两种不同的思考模式。
在Kahneman的理论中,系统一思维是快速、直觉、自动的,它处理日常的、熟悉的任务,比如识别熟悉的面孔或者理解简单的句子。
这种思维方式不需要我们有意识地思考,它依赖于我们的直觉和经验,但有时也可能导致错误,因为它不涉及深入的逻辑推理。
而系统二思维则是缓慢、逻辑、努力的,它涉及到深思熟虑、计算和推理。当我们面对复杂的、新颖的或者需要深入分析的问题时,就会启动系统二思维。这种思维方式需要我们集中注意力,消耗更多的认知资源,但它可以帮助我们做出更准确和深思熟虑的决策。
Brown直接将这个概念应用到AI领域,提出了一个革命性的想法:通过模拟人类的系统二思维,AI模型可以在不增加大量数据或计算资源的情况下显著提升性能。
以他开发的战胜人类的德扑AI Libratus为例,仅让AI在每手牌中思考20秒,就能获得与将模型扩大100,000倍相同的性能提升。这种方法的核心在于让AI模型在做出决策前进行更深入的分析和推理,而不是仅仅依赖于大规模数据和计算。
而OpenAI最新发布的o1模型同样引入了系统二思维,能够进行深度推理,模仿人类逐步解决问题的过程,通过自我对弈等强化学习训练方式提升推理能力。
例如,在国际数学奥林匹克资格考试中,o1模型凭借系统二思维准确推理复杂数学公式取得83%的准确率,远高于GPT -4o的13%。这对于金融、医疗、科研、编码等对数据要求严谨的行业来说非常重要。
所以,系统二思维对于增强大模型的能力有很多好处,使其能够更好地适应新的、未见过的任务和环境。在面对错误、不确定性和异常情况时,系统二思维还可以帮助大模型变得更加鲁棒,因为它鼓励模型采取更加谨慎和保守的策略。而在人机交互方面,模拟系统二思维能帮助大模型可以更好地理解和预测人类用户的需求和意图,从而改善交互体验。
关于Noam Brown
Brown曾就职于FAIR(Meta)在那里他和同事共同开发了 CICERO,这是首个在策略游戏外交中达到人类水平表现的AI。他还与卡内基梅隆大学的导师一起创建了 Libratus 和 Pluribus,这两个AI在人机对战比赛中战胜了顶尖人类德扑职业选手。
Libratus获得了AI杰出成就马文・明斯基大奖,Pluribus 则登上了《科学》杂志封面,并成为2019年《科学》年度突破奖的亚军。Brown还被评为麻省理工科技评论35位35岁以下创新者之一。
目前,Brown是OpenAI的高级研究科学家主要方向是超复杂推理、AI Agent以及自我对弈。
眼馋GPTs的人有福了,我们找到了一款不用花钱的平替
AI能替我完成工作吗?在研究AI的过程中,这个问题时常出现在我的脑海。比如关注我们的朋友应该知道,“头号AI玩家”有一个每日更新AI行业资讯的栏目「AI日报」,平时,我们的同事会轮流搜集信息进行整理编辑。这样的内容,可以让AI来帮我们完成吗?我试着用Poe做了一个新闻快讯AI机器人,来测试这一想法的可行性(至于Poe是个什么产品,我会在后文会进行解释)。站长网2023-11-13 21:47:380009AI图像高清修复工具SUPIR 可根据文本提示智能修复
要点:1、SUPIR通过增加模型的规模提升图像修复的能力,能够根据文本提示进行智能修复。2、SUPIR的主要功能包括图像修复和文本引导的修复,使用了模型放大、多模态技术3、实验展示了SUPIR在多个图像修复任务和复杂处理场景中的出色表现,以及其用户定制和交互性能。SUPIR是一个通过增加模型规模来提升图像修复能力的技术,它能够根据文本提示进行智能修复,提高图像修复的质量和智能程度。站长网2024-01-26 11:42:050002微信问一问搜索功能开始内测 进行种子用户招募
近日,微信“问一问”开启内测,进行种子用户招募。优质创作者即可报名体验,填写招募信息后,官方人员将会逐一筛选,让更多创作者参与。据了解,在问一问,创作者可以浏览微信内用户的常见问题,并对感兴趣的问题进行回答。优质的答案会在用户搜索相关问题时进行展现,帮助更多人解答问题。站长网2023-06-03 16:23:160001“决战”MCN的大戏,轮到程十安了
又一位顶流和MCN“闹分手”了。5月16日,媒体报道,@程十安小红书账号被封,此时其拥有854万粉丝。随即,网络上出现“程十安疑似被警察带走”的传言。而后,5月17日,@程十安发布两条微博,一条直接喊话缙嘉,“别装了,这么虚伪累不累。”@程十安微博截图站长网2023-05-24 09:04:460000北京星动纪元公司发布Xhand机械手 能撸猫能拿鸡蛋
北京星动纪元公司近期发布了一款名为Xhand的先进机械手,它具备12个主动自由度和内置的触觉传感器,能够实现高度精确的控制。这款机械手的性能令人印象深刻,它能够像人类一样温柔地抚摸猫咪、精确地操作剪刀、轻松地拿捏鸡蛋,以及执行各种复杂的任务。站长网2024-05-17 16:39:080002