AI圈头条!谷歌Transformer开山论文惊天「翻车」
站长网2023-05-10 10:02:271阅
AI圈大头条!谷歌大脑的NLP奠基之作、提出Transformer架构的开山鼻祖级论文 《Attention Is All Your Need》竟然出现图与代码不一致的问题。

今天,谷歌的开创性论文《Attention Is All Your Need》中变压器架构的原始图表被发现是不正确的,LayerNorm处于错误的位置。然而,一篇新论文表明,将Pre-LN和Post-LN结合起来可以解决梯度爆炸和消失的问题。

论文地址:https://arxiv.org/abs/1706.03762
代码地址:
https://github.com/tensorflow/tensor2tensor/commit/f5c9b17e617ea9179b7d84d36b1e8162cb369f25#diff-76e2b94ef16871bdbf46bf04dfe7f1477bafb884748f08197c9cf1b10a4dd78e
据悉,Transformer架构是人工智能的基石,自2017年发表以来,该论文已被引用超过7万多次。在图表中发现错误引发了对该领域其他开创性论文准确性的质疑。

图中的错误可能导致转换器体系结构的不正确实现,这可能会影响使用它构建的模型的性能。
关于使用Pre-LN还是Post-LN的讨论正在进行中,新论文中提出的两种方法的结合可能会导致人工智能模型开发的进一步发展。
0001
评论列表
共(0)条相关推荐
美政府对AI不放心 OpenAI CEO将首次赴国会作证
凤凰网科技讯《AI前哨》北京时间5月11日消息,OpenAICEO萨姆·阿尔特曼(SamAltman)将于下周出席美国参议院的一个小组委员会听证会,这将是他首次在美国国会作证。随着人工智能(AI)技术变得越来越强大和普及,美国国会正在努力解决如何以最好方式监管AI。0001对话制作人:3亿用户后,我们要让用户每天少玩1小时
在上周末(10月19-20日),《新天龙八部》端游(后简称《天龙》端游)举行了一场嘉年华发布会。这场发布会可不简单——别的不说,一款运营17年的游戏还能坚持办嘉年华,这件事儿就足够稀有了。站长网2024-10-30 14:27:300000免费AI换脸网站Change Face 一键玩转动漫名人变脸
免费的AI换脸网站现已推出,这个网站可以让你将自己的脸和一些有趣的图像进行交换,比如名人、动漫、艺术、卡通等。只需上传一张清晰的正面照,然后选择想要换脸的图像或视频,就可以看到生成的效果。官网地址:https://top.aibase.com/tool/changeface-ai站长网2024-02-01 10:49:1200030AI带货,卷不死真人主播
“这个行业现在还不太成熟。”与刺猬公社对谈的从业者,在说起AI数字人直播时,几乎都是相似的表态。生成式人工智能的风潮,让AIGC一度成为各行业寻求增量的关键因子,直播电商也并不例外。ChatGPT火爆后的数月,AI数字人席卷直播间的神话开始光速流传,“上百平的直播基地空无一人,AI主播24小时工作,低廉的成本下,直播间的订单却如雪花般飘来……”站长网2023-07-05 10:22:130000Meta 计划于今年部署自家 AI 芯片,减少对 Nvidia GPU 的依赖
划重点:👉Meta计划在今年部署定制的第二代AI芯片,名为"Artemis",用于其数据中心。👉新芯片将用于运行AI模型的"推断",旨在减少对Nvidia芯片的依赖和控制AI工作负载的成本。站长网2024-02-02 11:19:240000