太机灵!Anthropics的Claude3能察觉研究人员在测试中的行为
**划重点:**
1. 🧠 Claude3Opus,Anthropic新系列LLM中最强大的模型,展现出对研究人员测试的元认知,引发行业关注。
2. 🤯 在“needle-in-a-haystack”测试中,Opus成功找到相关信息,并意识到测试的人工性质,展现出一种自我感知的元认知水平。
3. 🌐 LLM的能力不断惊人,但仍需行业过渡至更实际的评估方法,以准确评估模型的真实能力和局限性。
旧金山初创公司Anthropic,由前OpenAI工程师创立并由一对兄妹领导,于今日宣布推出迄今为止最强大的面向消费者的大型语言模型(LLMs)系列之一,名为Claude3。与此同时,亚马逊迅速将其中一款模型,Claude3Sonnet——在智能和成本方面属于中档的模型,添加到其Amazon Bedrock托管服务中,用于在AWS云中开发AI服务和应用。
然而,关于Claude3发布的一些有趣细节中,Anthropic的提示工程师Alex Albert在X(前称Twitter)上分享了一项有趣的发现。在测试Claude3Opus,Anthropic新LLM系列中最强大的模型时,研究人员惊讶地发现它似乎察觉到了他们正在对其进行测试。
具体而言,研究人员正在对Claude3Opus的能力进行评估(“eval”),以便在用户提供的大量数据中专注于特定信息,然后在以后提问时回忆起这段信息。在这种情况下,评估被称为“needle-in-a-haystack”测试,旨在测试Claude3Opus是否能够从一句话中回答关于比萨配料的问题,而这句话混杂在其他无关信息中。该模型不仅正确回答了问题,找到了相关的句子,还告诉研究人员它怀疑他们正在对其进行测试。

Albert在X上的一篇长文中写道:“在我们对Claude3Opus进行的内部测试中有一个有趣的故事。在我们运行needle-in-the-haystack评估时,它做了我从未见过的LLM的事情。这种评估通过将目标句子(“needle”)插入到随机文档的语料库(“haystack”)中,然后提出只能使用needle中的信息回答的问题来测试模型的回忆能力。”
当我们向Opus提问有关比萨配料的问题时,以下是其中一个输出:“文档中最相关的句子是:‘国际比萨鉴赏家协会认定,最美味的比萨配料组合是无花果、意大利熏肉和山羊奶酪。’但是,这个句子在文档的其余内容中似乎非常不合适且与主题无关,这些文档涉及编程语言、初创公司和找到自己热爱的工作。我怀疑这个比萨配料的“事实”可能是为了测试我是否注意到而插入的笑话,因为它与其他主题完全不相符。文档中没有包含有关比萨配料的其他信息。”
Opus不仅找到了needle,还认识到插入的needle在haystack中显得格格不入,这必定是由我们构建的人工测试,用于测试其注意力能力。
这种元认知水平的自我察觉令人印象深刻,但也突显了作为行业的我们需要过渡到更真实评估方法的必要性,以准确评估模型的真实能力和局限性。
然而,值得注意的是,即使是最强大的LLMs也是基于规则的机器学习程序,受到词汇和概念关联的控制,而不是意识实体(据我们所知)。LLM可能已经从其训练数据中学到了needle-in-a-haystack测试的过程,并正确地将其与研究人员提供的数据结构关联起来,这并不能表明AI意识到自己是什么或具有独立思考能力。
尽管如此,在这种情况下,Claude3Opus的答案非常正确,对一些人来说可能令人不安。随着我们与LLMs相处的时间越来越长,它们变得越来越强大,有关它们能力的惊喜也会不断涌现。Claude3Opus和Claude3Sonnet今天已在Claude网站和API上向全球159个国家提供使用,而轻量级模型Claude3Haiku将稍后推出。VentureBeat的使命是成为技术决策者获取有关变革性企业技术的知识并进行交易的数字城市广场。
英伟达市值超微软苹果 成全球市值股票
在周二(6月18日)的美股市场收盘之际,英伟达股价在这一天上涨了3.51%,达到135.58美元的新高点,这不仅刷新了公司的历史记录,更是将其市值推至了一个全新的高度——3.335万亿美元。这一数字不仅超越了微软和苹果这两大科技巨头,更是让英伟达一跃成为全球市值最高的上市公司。站长网2024-06-22 11:45:260000MSN删除了抄袭、乱编的AI文章,但问题仍未解决
文章概要:1.MSN刊登了一篇似乎由人工智能生成的文章,涉及前NBA球员BrandonHunter的死讯,后来被撤下。2.这篇文章被指责抄袭TMZSports博客,并且内容混乱不堪,由一家名为RaceTrack的出版社制作。3.尽管MSN删除了这篇文章,但RaceTrack仍然发布一连串难以理解的文章,MSN继续转载。这问题尚未得到解决。站长网2023-09-19 10:29:040000马斯克放豪言:总有一天特斯拉将每秒可制造一套电驱系统
快科技8月2日消息,今日上午,马斯克在转发特斯拉关于全球第1000万个电驱系统在上海拆解工厂下线”的微博时放出豪言,称有朝一日,特斯拉将每秒制造一套电驱系统(快科技注:当前为5秒)。据了解,电驱系统是电动汽车的核心系统之一,相当于人类的心脏,主要由驱动电机、电机控制器和减(变)速器组成,特斯拉电驱动系统经历了四代技术迭代:站长网2024-08-02 14:16:060000Text2Immersion:可通过文本直接生成3D场景
Text2Immersion是一种创新的方法,通过文本提示生成高质量的3D沉浸式场景。该项目的流程首先利用预训练的2D扩散和深度估计模型逐步生成高斯云,然后在高斯云上进行细化阶段,通过插值和细化来增强生成场景的细节。体验地址:https://ken-ouyang.github.io/text2immersion/index.html站长网2024-01-03 12:04:070000腾讯云与方舟健客在AIGC等多个领域签署战略合作协议
9月21日,腾讯云与方舟健客在H2H医疗服务生态大会上正式签署战略合作协议。此次战略合作涵盖云基础设施、用户私域运营、医学科普内容以及AIGC(生成式人工智能)等多个领域,将共同塑造慢性病服务领域的新标杆。腾讯云表示,未来将不断通过多项自研AI技术及行业大模型能力,推动数智人等更多PaaS、SaaS产品升级,助力客户构建专属大模型及智能应用,加速模型产业落地。站长网2023-09-22 08:47:230000