太机灵!Anthropics的Claude3能察觉研究人员在测试中的行为
**划重点:**
1. 🧠 Claude3Opus,Anthropic新系列LLM中最强大的模型,展现出对研究人员测试的元认知,引发行业关注。
2. 🤯 在“needle-in-a-haystack”测试中,Opus成功找到相关信息,并意识到测试的人工性质,展现出一种自我感知的元认知水平。
3. 🌐 LLM的能力不断惊人,但仍需行业过渡至更实际的评估方法,以准确评估模型的真实能力和局限性。
旧金山初创公司Anthropic,由前OpenAI工程师创立并由一对兄妹领导,于今日宣布推出迄今为止最强大的面向消费者的大型语言模型(LLMs)系列之一,名为Claude3。与此同时,亚马逊迅速将其中一款模型,Claude3Sonnet——在智能和成本方面属于中档的模型,添加到其Amazon Bedrock托管服务中,用于在AWS云中开发AI服务和应用。
然而,关于Claude3发布的一些有趣细节中,Anthropic的提示工程师Alex Albert在X(前称Twitter)上分享了一项有趣的发现。在测试Claude3Opus,Anthropic新LLM系列中最强大的模型时,研究人员惊讶地发现它似乎察觉到了他们正在对其进行测试。
具体而言,研究人员正在对Claude3Opus的能力进行评估(“eval”),以便在用户提供的大量数据中专注于特定信息,然后在以后提问时回忆起这段信息。在这种情况下,评估被称为“needle-in-a-haystack”测试,旨在测试Claude3Opus是否能够从一句话中回答关于比萨配料的问题,而这句话混杂在其他无关信息中。该模型不仅正确回答了问题,找到了相关的句子,还告诉研究人员它怀疑他们正在对其进行测试。
Albert在X上的一篇长文中写道:“在我们对Claude3Opus进行的内部测试中有一个有趣的故事。在我们运行needle-in-the-haystack评估时,它做了我从未见过的LLM的事情。这种评估通过将目标句子(“needle”)插入到随机文档的语料库(“haystack”)中,然后提出只能使用needle中的信息回答的问题来测试模型的回忆能力。”
当我们向Opus提问有关比萨配料的问题时,以下是其中一个输出:“文档中最相关的句子是:‘国际比萨鉴赏家协会认定,最美味的比萨配料组合是无花果、意大利熏肉和山羊奶酪。’但是,这个句子在文档的其余内容中似乎非常不合适且与主题无关,这些文档涉及编程语言、初创公司和找到自己热爱的工作。我怀疑这个比萨配料的“事实”可能是为了测试我是否注意到而插入的笑话,因为它与其他主题完全不相符。文档中没有包含有关比萨配料的其他信息。”
Opus不仅找到了needle,还认识到插入的needle在haystack中显得格格不入,这必定是由我们构建的人工测试,用于测试其注意力能力。
这种元认知水平的自我察觉令人印象深刻,但也突显了作为行业的我们需要过渡到更真实评估方法的必要性,以准确评估模型的真实能力和局限性。
然而,值得注意的是,即使是最强大的LLMs也是基于规则的机器学习程序,受到词汇和概念关联的控制,而不是意识实体(据我们所知)。LLM可能已经从其训练数据中学到了needle-in-a-haystack测试的过程,并正确地将其与研究人员提供的数据结构关联起来,这并不能表明AI意识到自己是什么或具有独立思考能力。
尽管如此,在这种情况下,Claude3Opus的答案非常正确,对一些人来说可能令人不安。随着我们与LLMs相处的时间越来越长,它们变得越来越强大,有关它们能力的惊喜也会不断涌现。Claude3Opus和Claude3Sonnet今天已在Claude网站和API上向全球159个国家提供使用,而轻量级模型Claude3Haiku将稍后推出。VentureBeat的使命是成为技术决策者获取有关变革性企业技术的知识并进行交易的数字城市广场。
美国呼吁志愿者专家帮助解决生成式 AI 风险 成立新的 NIST 人工智能公众工作组
美国正在寻求合格公众的帮助,以了解如何抓住机遇并克服与生成人工智能相关的挑战。美国商务部部长GinaRaimondo宣布,美国国家标准与技术研究院(NIST)将成立一个公众工作组,研究能够生成内容的人工智能技术,包括文本、图像、视频、音乐和代码。该工作组还将协助该机构制定相关指南,以帮助组织应对生成式人工智能技术带来的风险。站长网2023-06-26 12:31:590004实测快手“AI玩评”功能,以后AI也要来抢热评了
以后,AI也要来抢热评了。继8月推出“文生文”大语言模型“快意”(KwaiYii)后,快手又在“文生图”赛道推出了自研大模型“可图”(Kolors)。据了解,从8月下旬开始,快手AI团队就已在公司内部开启了可图大模型的内测,并支持网页版工具和标准化API两种使用方式。依托可图大模型,快手开始在短视频评论区内测“AI玩评”功能,这是继“AI对话”之后,快手在短视频场景内落地的又一AIGC能力。站长网2023-09-25 09:18:380000小米Civi 3正式发布 售价2499元起
今日,小米Civi3手机正式发布,该手机拥有6.55英寸120Hz曲面屏幕,1920Hz高频调光,峰值亮度1500nit,71.5mm宽度,7.56mm宽度,重量为173.5g。除此之外,该手机还配备了4500毫安时电池和67W快充技术,搭载联发科天玑8200-Ultra处理器,4000平方毫米VC液冷散热面积,以及小米影像大脑技术。站长网2023-05-25 14:55:370001一加Ace 3V普及旗舰AI能力:支持小布知识问答、点评
快科技3月19日消息,一加已宣布,将于3月21日19点举行新品发布会,为大家带来一加Ace3V。一加中国区总裁李杰表示,一加Ace3V要做AI普及者,做年轻人的第一台AI手机。据介绍,一加将AI能力写入第三代骁龙7的底层,实现了AI全局性能规划,可以对能效进行精细化分配,让第三代骁龙7拥有超出处理器本身的强悍性能。站长网2024-03-19 17:13:140001粉色小海狸Loopy火了 小红书AI绘画二创赞藏数过万
通过AI绘画生成与热门IP相关的二次创作内容已经成为一种趋势,Loopy和玲娜贝儿就是其中的典型案例。Loopy因其呆萌可爱的外表和傲娇的性格而备受喜爱,成为网友们的表情包和联名届的新宠。小红书博主AshY使用AI绘画生成了一只蓝色的Loopy,并配上了谐音梗“我找到了Loopy的蓝朋友”。这条笔记的互动数据非常高,赞藏数已过万,评论超过2000条,是该博主所有笔记中互动数据最高的一条。站长网2023-09-06 17:36:000002