依一带你探索大语言模型的智能涌现能力
导读:大型语言模型是一个特别有趣的案例研究,因为它们已经显示出非常明显的智能涌现现象。LLM 是非常大的transformer 神经网络,通常跨越数千亿个参数,在少量的文本数据上进行训练,可用于范围广泛的任务,包括文本生成、问答、摘要等。目前,判别LLM是否已经具有智能涌现能力,我们首先就如何界定智能涌现并给出可重复涌现实例达到共识。
今天,依一就带大家一起来探索大语言模型(LLM)是否会#智能涌现#相关问题。
智能涌现
在物理学、生物学和计算机科学等领域长期讨论的智能涌现现象是否已经出现,目前仍存在普遍争议。1972年,诺贝尔奖获得者物理学家菲利普安德森在《科学》周刊上发表一篇题为“More Is Different”的文章中,讨论了量变可能导致质变和意想不到的#智能涌现#。
受安德森工作的启发,加州大学伯克利分校教授雅各布·斯坦哈特 (Jacob Steinhardt)将涌现定义为“当系统中的量变导致行为发生质变时”。
为了识别大型语言模型中的涌现能力,研究人员寻找相变,在一定规模阈值以下,模型性能接近随机,而超过该阈值,性能远高于随机。这将涌现能力与随规模平稳提升的能力区分开来:预测涌现能力何时出现要困难得多。因为规模可以用不同的方式衡量,包括计算 (FLOPs)、模型大小(参数数量)或数据大小。
由于我们想提供一个更精确的定义,因此,依一这里将涌现能力定义为“不存在于较小模型中但存在于较大模型中’的能力”。
造词
造新词是一个常见的具有创造性的智力任务。今天我们就来看看Claude如何完成相关造新词的任务的,以及是否会智能涌现。
实验准备。首先,我们先来了解一些实验的背景知识。
“Supercalifragilisticexpialidocious” 是1964年迪士尼音乐电影Mary Poppins中的一首歌曲和单曲。它由谢尔曼兄弟创作,由朱莉·安德鲁斯和迪克·范·戴克演唱。它也出现在2004年的舞台剧版中。因为《欢乐满人间》是1910年的一段时期作品,所以需要听起来与那个时期的歌曲相似的歌曲。电影版在AFI 的100 年历史上100首美国电影热门歌曲榜单(AFI's 100 Years...100 Songs)中名列第 36 位。
有兴趣的网友可以关注我整理的视频(西瓜视频@YiyiKing,https://www.ixigua.com/7235889781119549989)。该视频来自Walt Disney Productions,包含《欢乐满人间》(Mary Poppins)中的歌曲“Supercalifragilisticexpialidocious”,采用数字修复和重新灌录形式,取自电影 2013 年发行的 DVD。https://www.ixigua.com/7235889781119549989
简言之,supercalifragilisticexpialidocious是一个虚构的英语词,没有确切的中文意思。它由许多英语词的片段拼接而成,意在发挥语言的聲韻之美,表达一种轻快活泼的心情和意境。通过其音节的组合和发音,在语言形式上构造出一种轻快活泼的效果和意境。它通常用于描述一些在音乐性、节奏性和动态性方面都富有魅力的事物,用语言营造出一种俏皮玩味的氛围和心情。所以在理解和翻译这个字时,需要着眼于表达其在审美形式和意境上的效果,而不必钻研其空无的语义。
例句:The supercalifragilisticexpialidocious song and dance number was a highlight of the show. (这个旋律动听、节奏明快的歌舞表演是整场表演的一大亮点。)
这个句子使用了supercalifragilisticexpialidocious这个字来描述一段音乐和舞蹈的表演,表达它旋律优美、节奏感强的效果,给人一种轻快愉悦的心情。在中文的解释中,我选用“旋律动听、节奏明快”来表达这个意思,和原句使用的那个虚构词在意境和效果上是相通的,都在强调这个表演在听觉和旋律方面给人以愉悦和乐趣的深刻感受。
实验动机:利用生成式AI模型创建supercalifragilisticexpialidocious类似风格的新词。第1步,让Claude熟悉supercalifragilisticexpialidocious:
事实上,Claude可以很好地总结supercalifragilisticexpialidocious相关先验知识。
第2步,让Claude分析它的读音及其构词过程:
Claude同样很准确地为我们完成了任务。
第3步,我让Claude帮我们回忆1964年迪士尼音乐电影Mary Poppins中单曲supercalifragilisticexpialidocious的歌词:
第4步,让Claude帮我们分析单曲supercalifragilisticexpialidocious歌词中的旋律:
第5步,开始让Claude帮我们造10个类似的新词,要求新词易拼读、有优美的韵律:
于是,Claude返回10个新词,分别是:
Splendiferocious - splendidly ferocious, fiercely magnificentWonderiffic - wonderfully terrific, terrifically wonderfulFantabulous - fantastically fabulous, fabulously fantasticAmazadelic - amazingly psychedelic, psychedelically amazingExcitiferrous - excitingly joyful, joyfully excitingSensationalish - sensationally stylish, stylishly sensationalStupendincredible - stunningly incredible, incredibly stunningMagimystical - magically mystical, mystically magicalPhenomeniffic - phenomenally terrific, terrifically phenomenalGloribibble - gloriously garrulous, garrulously glorious
第6步,10个不够,让Claude再10个:
第7步,如果觉得新词不够长,让Claude再10个更长的新词:
第8步,让Claude利用刚刚造的10个较长的新词为我们各造一个句子:
到此,我们大致有了一个基本认知,Claude不仅能很好地总结与supercalifragilisticexpialidocious相关的先验知识,为我们创造字典上没有出现过的新词,而且满足较高的要求,如由许多英语词的片段拼接而成,意在发挥语言的聲韻之美,表达一种轻快活泼的心情和意境。
造新词并创作新诗
既然Claude可以创造一系列风格的新词,我们再来进一步发挥它的创造性。让它帮我们创作一首诗情画意的诗:
至于,今天的实验结果,能否说明大语言模型具有智能涌现能力。依一说了不算,元芳你怎么看?(Yiyi King)
iPhone15多次降价重回销量榜第一:全系霸榜前三
站长之家(ChinaZ.com)6月18日消息:随着618大促的尾声渐近,微博话题“iPhone15多次降价重回销量榜第一”瞬间成为热搜焦点。在这波促销浪潮中,iPhone15系列凭借多次降价策略,成功逆袭,重回销量榜的巅峰。站长网2024-06-18 20:03:260000所有知识付费都可以用 ChatGPT 再割一次?
伴随春天一起到来的,还有如雨后春笋般冒出的ChatGPT/AI相关的付费社群、课程训练营、知识星球等。ChatGPT吹来的这股AI热潮,这几个月想必大家多多少少都能感受到。▲图片来源:网络这两张图是最近在圈子里看到的。站长网2023-04-12 18:22:040000深入解析SDXL潜在空间以及如何改善其生成图像的方法
要点:SDXL潜在空间包括4个通道,分别是亮度、青/红、绿/紫、图案/结构。SDXL生成的颜色范围偏向黄色,原因是模型在生成过程中更偏向认知中的亮度、青/红、绿/紫,而相对较少使用蓝色。通过实验性地探索SDXL潜在空间,作者提出了一些纠正SDXL输出的方法,包括去除异常值、平衡颜色、增加颜色范围等。站长网2023-11-24 11:32:320006短视频网红博主遭小程序“AI换脸” 法院判决后者侵犯肖像权
据江苏高院公众号消息,近日,江苏高院公布了一起因“AI换脸”技术引发的肖像权纠纷。小林是某短视频平台的小网红,拥有一定数量的关注者,日常在平台上发布自己出镜的国风短视频。站长网2023-07-04 14:40:290000从14核CPU到AI游戏,浅析Arm新架构的更多细节
前段时间,我们三易生活已经给大家分析过Arm最新一代的CPU和GPU架构设计,不过当时的资料主要还是来源于官方博客文章,以及面向大众公布的相关信息。考虑到这些资料的宣传目的,它们通常并不会讲得特别详细,特别是在一些技术细节、研发背景等方面往往会比较为缺乏。这也就是为什么我们会在当时的内容中指出其中的一些性能对比的数据缺乏参数说明,甚至可能会影响到可信度的原因。站长网2024-06-17 04:50:210000