Anthropic 展示它的 AI 训练与 OpenAI 不同之处:不需要人工标注有害信息
Anthropic 是一家由前 OpenAI 高管创立的初创公司,它似乎正试图在快速发展的市场中开辟自己的明确位置,为由大型语言模型(称为生成 AI)提供支持的服务提供服务。
Claude 是一个人工智能聊天机器人,类似于 OpenAI 的 ChatGPT,Anthropic 在三月份发布。
在一篇博客文章中,这家初创公司解释了它用来训练其类似 ChatGPT 的聊天机器人 Claude 的方法,以产生比其他聊天机器人危害更小、更准确的结果。
Anthropic 详细介绍了其「Constitutional AI」训练方法,旨在为其 Claude 聊天机器人注入明确的「价值观」,以解决人工智能系统透明度、安全性和决策制定等方面的担忧,而无需依赖于人类反馈来评估响应。
Anthropic 表示,随着 AI 系统的不断发展,我们希望能够借助它们来监督其他的 AI。我们正在尝试一种方法,通过自我提升训练一个无害的 AI 助手,而不需要任何人工标注有害输出内容。
唯一的人工监督是通过一系列规则或原则来实现的,因此我们称之为「Constitutional AI」。这个过程涉及到有监督的学习和强化学习两个阶段。
在有监督的阶段,我们从一个初始模型中进行采样,然后生成自我批评和修订的结果,再将修订后的结果微调到原始模型中。
在强化学习阶段,我们从微调后的模型中进行采样,使用一个模型来评估哪个采样结果更优秀,然后从这个 AI 喜好数据集中进行偏好模型的训练。
之后,我们使用偏好模型作为奖励信号,即「AI 反馈的强化学习」(RLAIF)进行训练。因此,我们能够训练出一个无害但非侵入式的 AI 助手,通过解释其反对有害查询的理由来进行交互。无论是有监督学习还是强化学习,这些方法都能利用链式思维推理来改善 AI 决策性能和透明度,使得控制 AI 行为变得更加精确,并且需要的人工标注更少。
乐视面试简历无需填写年龄和婚育信息
3月7日,乐视官方账号发布重要声明,宣布在招聘环节做出创新调整。从即日起,乐视将不再要求应聘者在简历中填写年龄、婚育等个人情况。同时,在办理入职流程以及在职期间,乐视将严格限制员工个人资料的查看权限,只有负责员工档案管理的人员才有权查阅应聘者的身份证件等相关信息。站长网2024-03-07 16:20:180000不止AI音频、还打破了连接界限,第一代高通S7系列音频平台解析
最近这几天,高通方面在夏威夷举行的2023骁龙峰会上发布了多款全新的芯片。除了我们三易生活此前已经为大家做过详细解析的骁龙XElite和第三代骁龙8这两款“大芯片”外,其实还有两款体积上比较小,但在技术层面同样“重量级”的方案也很值得关注。站长网2023-10-29 10:05:160000英特尔出售 1.47 亿美元 Arm 股份,应对财务危机与裁员潮
近日,英特尔公司在财务困境和大规模裁员的背景下,决定出售其在芯片设计Arm的所有股份,具体数量为118万股。这一消息是通过特尔提交的最新13F表格披露的,显示在上一季度持有的Arm股份市值约为1.47。此次股权出售后,英特尔已不再持有任何Arm的,目前Arm仍由日本软银集团控股。站长网2024-08-16 15:27:000000视频转视频框架AnyV2V 可修改源视频主题、风格等
近期,一项名为AnyV2V的全新视频转视频框架引起了广泛关注。这一框架的独特之处在于,它不仅支持对源视频进行深度修改,还能加入附加的控制元素,如文本提示、主题或风格,以生成一个既与原视频相符,又与所提供的控制内容相匹配的新视频。论文地址:https://arxiv.org/html/2403.14468v1#S6站长网2024-03-23 05:18:220000