Anthropic 展示它的 AI 训练与 OpenAI 不同之处:不需要人工标注有害信息
Anthropic 是一家由前 OpenAI 高管创立的初创公司,它似乎正试图在快速发展的市场中开辟自己的明确位置,为由大型语言模型(称为生成 AI)提供支持的服务提供服务。
Claude 是一个人工智能聊天机器人,类似于 OpenAI 的 ChatGPT,Anthropic 在三月份发布。
在一篇博客文章中,这家初创公司解释了它用来训练其类似 ChatGPT 的聊天机器人 Claude 的方法,以产生比其他聊天机器人危害更小、更准确的结果。
Anthropic 详细介绍了其「Constitutional AI」训练方法,旨在为其 Claude 聊天机器人注入明确的「价值观」,以解决人工智能系统透明度、安全性和决策制定等方面的担忧,而无需依赖于人类反馈来评估响应。
Anthropic 表示,随着 AI 系统的不断发展,我们希望能够借助它们来监督其他的 AI。我们正在尝试一种方法,通过自我提升训练一个无害的 AI 助手,而不需要任何人工标注有害输出内容。
唯一的人工监督是通过一系列规则或原则来实现的,因此我们称之为「Constitutional AI」。这个过程涉及到有监督的学习和强化学习两个阶段。
在有监督的阶段,我们从一个初始模型中进行采样,然后生成自我批评和修订的结果,再将修订后的结果微调到原始模型中。
在强化学习阶段,我们从微调后的模型中进行采样,使用一个模型来评估哪个采样结果更优秀,然后从这个 AI 喜好数据集中进行偏好模型的训练。
之后,我们使用偏好模型作为奖励信号,即「AI 反馈的强化学习」(RLAIF)进行训练。因此,我们能够训练出一个无害但非侵入式的 AI 助手,通过解释其反对有害查询的理由来进行交互。无论是有监督学习还是强化学习,这些方法都能利用链式思维推理来改善 AI 决策性能和透明度,使得控制 AI 行为变得更加精确,并且需要的人工标注更少。
西湖心辰获百度、汤姆猫投资 大模型RIO能力已达GPT-3.5水平
据心辰科技官方消息,人工智能科技公司西湖心辰(杭州)科技有限公司宣布获汤姆猫战略投资,至此,汤姆猫将成为西湖心辰团队外的最大外部股东,本轮融资将主要用于多模态大模型的研发迭代以及业务拓展,持续推动公司大模型的通用人工智能能力提升,进一步深化布局AGI时代。据了解,3月底,心辰科技已完成数百万美元的Pre-A轮融资,本轮融资由百度风投领投。站长网2023-04-23 10:57:530008致无数Windows设备蓝屏崩溃 CrowdStrike来头有多大:美国网安头部企业
快科技7月21日消息,近日全球范围内的Windows系统电脑遭遇了一场前所未有的蓝屏危机”,数百万台电脑无法正常启动。该事件影响范围之广,被澳大利亚政府网络安全顾问特洛伊亨特描述为全球有史以来规模最大的IT故障”。而引发这场事故的,正是美国网络安全领域头部企业CrowdStrike的一次软件升级。0000被AI客服聊到生气的遭遇上热搜 专家:应加强人工智能客服监管
今日,话题“被AI客服聊到生气的遭遇”登上微博热搜,据央视新闻报道,智能客服虽然能降低企业成本和缩短响应时间,但消费者反映智能客服通常不够智能,无法准确理解问题,回答不恰当,还会导致消费者耐心受挑战。消费者普遍希望智能客服更加智能、高效地解决问题。站长网2024-03-15 15:46:390000苏宁易购:全国600家门店全线入驻饿了么平台
苏宁易购与饿了么宣布达成战略合作,成为正式入驻饿了么平台的首家家电3C品类大型连锁品牌。双方合作宣布于5月23日正式启动。苏宁易购将首批全国600家门店覆盖150余个城市,全线登陆饿了么平台。消费者可通过“饿了么”APP搜索“苏宁易购”,下单购买包括手机通讯、数码电脑、生活家电等在内的3000余种商品,全城最快30分钟送货到家。站长网2023-05-23 15:02:120000Meta重磅更新,小扎在元宇宙里养了会做家务的狗!人形化身超逼真,AI智能体在真实物理世界和人互动
【新智元导读】今天,Meta重磅发布了Habitat3.0,经它训练的AI智能体,学会了找人,还能帮人打扫房间。社交智能机器人,进入下一个里程碑!今天开始,人类离帮忙做家务的机器人,又近了一步!Meta宣布推出Habitat3.0,目的是开发出社会化的AI智能体,这意味着社交智能机器人已经进入新的里程碑阶段。站长网2023-10-21 14:37:490000