首页站长资讯重现当年AlphaGo神来之笔！DeepMind新AI发现提速70%排序算法，十年都没更的C++库更新了

重现当年AlphaGo神来之笔！DeepMind新AI发现提速70%排序算法，十年都没更的C++库更新了

站长网2023-06-11 22:41:510阅

DeepMind又双叒叕带着重磅成果登Nature了!

这一次，他们又一强化学习AI，在计算机领域最最最基础的两个算法上做了新突破:

一个是排序算法，发现了速度最高可提升70%的新实现;

另一个是哈希算法，也找到了速度提高30%的新方法。

不仅如此，该AI所用方法被称为“重现当年AlphaGo的神来之笔”，也就是看似违法直觉，实则一举击败人类高手李世石的那次。

消息一出，立刻引爆学术圈，有网友就直呼:

没想到这么古老又基础的算法还能被进一步改进。

而正是因为这一最新成果，十年都没有更新的LLVM标准C 库都更新了，并且数十亿人将会受益。

因为，无论是排序还是哈希，它们的应用场景从在线购物、云计算到供应链管理等各个场景都能用到，每天会被调用上亿次!

不过，如DeepMind所说:

大家千万不要太兴奋了，AI的力量用于代码效率提升才刚刚开始。

Alpha家族“新贵”发现更快排序算法

这个AI名叫AlphaDev，属于Alpha家族“新贵”，并且基于AlphaZero打造（就是2017年击败世界冠军的那个棋类AI）。

它的发现并非基于现有算法，而是从最底层的汇编指令开始摸索的。

DeepMind的研究员给它设计了一种单人“组装”游戏:

只要能够搜索并选择出合适的指令（下图A流程），正确且快速地排好数据(下图B流程)，就能获得奖励。

但这个游戏的挑战不仅在于搜索空间的大小（可组合指令数相当于宇宙中的粒子数），也在于奖励函数的性质，因为一条错误指令就可能会使整个算法失效。

AlphaDev拥有两个核心组件:学习算法和表示函数。

其中，学习算法主要是在强大的AlphaZero上扩展的，它可以结合DRL和随机搜索优化算法来进行巨量的指令搜索;主要的表示函数则基于Transformer，它能够抓住汇编程序的底层结构，并表示成特殊的序列。

随着AlphaDev不断地打怪升级，研究员还会限制它能执行的步数，以及待排序列的长度。

最终，AlphaDev发现了一种全新排序算法:

如果序列较短，相比人类基准排序算法，它能将速度提高70%;如果序列长度超过25000个元素，则提高1.7%。

（3-5个元素的短序列排序其实使用非常广泛，因为它能够作为较大排序函数的一部分被多次调用。因此，只要改进了短序列，任意数量序列的整体排序速度都能得到提高。）

具体而言，该算法的创新主要在于两种指令序列:

（1）AlphaDev Swap Move（交换移动）

（2）AlphaDev Copy Move（复制移动）

如下图所示，左边是利用了min（A，B，C）的原始sort3实现，右边是通过“AlphaDev Swap Move”，只需要min(A，B)的实现。能够发现可以省掉一步指令，还只需要算出A和B的最小值即可。

作者表示，这种新颖的方法让人想起当年AlphaGo的“第37步”——一种违反直觉的下法却直接击败传奇围棋选手李世石，让观众全都震惊不已。

同样，AlphaDev则是通过交换和复制移动，跳过了一个步骤，以一种看似错误但实际上是捷径的方式达成目标。

如下图所示，在对8个元素进行排序的算法中，AlphaDev也同样利用“AlphaDev Copy Move”，用max （B， min (A， C）)替换了原始实现中更为复杂的max (B， min (A， C， D))指令，并且使整个算法的指令总数也减少了一步。

而在发现更快的排序算法后，作者也用AlphaDev试了试哈希算法，以此证明其通用性。

结果也没有让人失望，AlphaDev在9-16字节的长度范围内也实现了30%的速度提升。

和排序算法一样，他们已将新方法集成到了Abseil库中，全球数百万开发人员现在都可以使用。

最后，作者表示，两种新算法的实现显示AlphaDev具有强大的发现原始解决方案的能力，并且将使我们进一步思考计算机领域基础算法的改进方式。

不过，由于本次研究中使用的汇编语言具有局限性，他们接下来还是打算尝试AlphaDev在高级语言（如 C ）中优化算法的能力。

网友:不算发现新的排序算法

对于这一成果，不少人表示非常兴奋。

如这位网友所说:

AlphaGo惊艳全世界后，强化学习还能做什么?还能做任何有实际意义的事情吗?这就是答案。

不过这次，有不少人指出，DeepMind似乎有夸大标题的嫌疑。

它计算的是算法延迟，而非传统意义上的时间复杂度。如果真算时间复杂度，数据可能不好看。

它改进的并不是排序本身，而是在现代CPU上做新的排序（特别是短序列）。这种操作其实不算罕见，比如FFTW、ATLAS这些库就是这么做的。

同意，他们只是为特定CPU找到了更快的机器优化，并不算发现新的排序算法，方法本身很酷，但还不算开创性研究。

大家怎么看?

论文地址:

https://www.nature.com/articles/s41586-023-06004-9

官方博客:

https://www.deepmind.com/blog/alphadev-discovers-faster-sorting-algorithms?utm_source=twitter&utm_medium=social&utm_campaign=OCS

参考链接:

[1]https://twitter.com/demishassabis/status/1666545516941803520

[2]https://news.ycombinator.com/item?id=36228125

[3]https://twitter.com/DeepMind/status/1666462540367372291

重现当年AlphaGo神来之笔DeepMind新AI发现提速70排序算法十年都没更的Cx2Bx2B库更新了

0000

评论列表

共(0)条

相关推荐

站长资讯
撕掉“直男天堂”标签圈粉女性，迪卡侬是如何逆袭的？
过去，迪卡侬总被称之为“直男天堂”，店内清一色的“黑白灰”色衣服，充斥着浓浓工业风的装修风格，粗糙的商品货架，都与“都市丽人”毫不沾边。最近，迪卡侬的社交热度有所上涨，其中“迪卡侬女孩”“迪卡侬穿搭”等话题引起广泛讨论。而在小红书上，有关迪卡侬的笔记数量达到了10万，各种穿搭以及探店内容层出不穷。从最初的“直男天堂”到如今成功圈粉年轻女性群体，迪卡侬是如何逆袭的?
站长网2023-08-31 18:18:05
0001
站长资讯
米粉期待值拉满！雷军重回小米手机发布会
快科技7月10日消息，小米产品经理魏思琪与米粉互动时确认，本月小米MIXFold4和小米MIXFlip发布会由雷军主持。在评论区，米粉纷纷表示期待。此前在2月份，小米14Ultra发布会由卢伟冰主持，当时雷军将更多精力放在了小米汽车业务上。雷军还强调，手机业务始终是小米的核心业务，他会持续保持足够的精力投入。
站长网2024-07-11 09:24:56
0000
站长资讯
当保险销售开始做博主，收入能翻番，但成功率不足2%？
在雷军靠个人IP给汽车行业带来极大震撼后，越来越多行业开始思考:个人IP能为业务带来新可能吗?短视频、直播能带来更多曝光、客户和变现吗?这一点，在保险行业体现得尤为明显。相比早年的线下拜访，越来越多保险人选择走到镜头前，用短视频、直播的方式和客户沟通。据新榜旗下数据工具新抖统计，用关键词“保险”搜索，万粉以上的抖音账号至少有2594个。
站长网2024-11-17 11:54:21
0000
站长资讯
避免升级出现问题：微软建议用户买新电脑安装Win 11
快科技10月7日消息，微软公司近期更新了其官方支持文档，并指出，想要升级至Windows11，最推荐的方法是购买一台全新的电脑。据了解，Windows10的支持期限为2025年10月14日，在该日期之后，微软将不再为Windows10提供安全更新和技术支持。但微软也说明，即便支持结束，用户的电脑仍然可以正常工作。
站长网2024-10-10 10:03:00
0000
独立开发变现周刊（第154期）：月收入2.5万美金社交媒体主页工具
目录1、Guidejar:创建产品指南和演示工具2、FreeAPI:开源的APIs项目3、【粉丝自荐】Biofy-定制化个人主页4、Noteforms:通过Notion创建表单的工具月收入3万美金5、一个月入2.5万美金的链接工具1、Guidejar:创建产品指南和演示工具通过交互式、易于跟随的AI驱动指南和演示，简化复杂流程。这个产品月收入2千美金。其主要功能包括:
站长网站长资讯2024-10-25 16:58:34
0000