Anthropic 展示它的 AI 训练与 OpenAI 不同之处:不需要人工标注有害信息
Anthropic 是一家由前 OpenAI 高管创立的初创公司,它似乎正试图在快速发展的市场中开辟自己的明确位置,为由大型语言模型(称为生成 AI)提供支持的服务提供服务。
Claude 是一个人工智能聊天机器人,类似于 OpenAI 的 ChatGPT,Anthropic 在三月份发布。
在一篇博客文章中,这家初创公司解释了它用来训练其类似 ChatGPT 的聊天机器人 Claude 的方法,以产生比其他聊天机器人危害更小、更准确的结果。
Anthropic 详细介绍了其「Constitutional AI」训练方法,旨在为其 Claude 聊天机器人注入明确的「价值观」,以解决人工智能系统透明度、安全性和决策制定等方面的担忧,而无需依赖于人类反馈来评估响应。
Anthropic 表示,随着 AI 系统的不断发展,我们希望能够借助它们来监督其他的 AI。我们正在尝试一种方法,通过自我提升训练一个无害的 AI 助手,而不需要任何人工标注有害输出内容。
唯一的人工监督是通过一系列规则或原则来实现的,因此我们称之为「Constitutional AI」。这个过程涉及到有监督的学习和强化学习两个阶段。
在有监督的阶段,我们从一个初始模型中进行采样,然后生成自我批评和修订的结果,再将修订后的结果微调到原始模型中。
在强化学习阶段,我们从微调后的模型中进行采样,使用一个模型来评估哪个采样结果更优秀,然后从这个 AI 喜好数据集中进行偏好模型的训练。
之后,我们使用偏好模型作为奖励信号,即「AI 反馈的强化学习」(RLAIF)进行训练。因此,我们能够训练出一个无害但非侵入式的 AI 助手,通过解释其反对有害查询的理由来进行交互。无论是有监督学习还是强化学习,这些方法都能利用链式思维推理来改善 AI 决策性能和透明度,使得控制 AI 行为变得更加精确,并且需要的人工标注更少。
韩国AI研究机构出品!MagiCapture:个性化生成高分辨率肖像照片
文章概要:-MagiCapture是韩国AI研究机构的最新成果,致力于解决多概念定制挑战,实现高质量肖像照片的个性化生成。-该方法采用多概念定制,融合主题和风格概念,只需少量参考即可生成高分辨率肖像照片。-研究人员提供了新的注意力重新聚焦损失、即时学习策略,在定量和定性评估中明显优于基线方法。站长网2023-09-19 14:44:100002StabilityAI API最新功能 可通过文字对指定区域进行编辑替换
StabilityAIAPI的最新功能提供了一种通过文字对图片指定区域进行编辑替换的能力。这意味着用户可以使用文字描述的方式,精准地指定图片中需要编辑的区域,并进行相应的替换操作。这项功能的推出将极大地简化用户对图片编辑的流程,提高效率。这里查看具体的API功能:https://platform.stability.ai站长网2024-02-26 09:59:180000针对PS的AI插件“Alpaca” 可将草图转为艺术作品
Alpaca是一款专为艺术家设计的个性化AI工具包,旨在帮助用户更深入地探索、更快速地迭代,并发挥创意潜能。它是一个针对AdobePhotoshop的插件,将人工智能图像生成能力与人类技能相结合。体验地址:https://www.alpacaml.com/核心功能:从草图中生成图像:将自己的草图转化为栩栩如生的艺术作品。控制图像生成:从草图和参考图像开始,指导艺术作品的构图。站长网2023-08-14 15:47:330000小米发布新项目SDXS,大幅提升SD图像生成速度
近日,小米发布了一项名为SDXS的项目,该项目旨在大幅增强SD图像生成速度。据悉,SDXS可以在单个GPU上实现SD1.5每秒100张图的生成速度,而SDXL则能达到每秒30张图的生成速度。这一项目估计是为了在小米的本地设备上运行SD模型而研究的。站长网2024-03-27 12:54:200002AI人才争夺战:平均年薪40万,互联网大厂成加分项
年薪30万,居然是“白菜价”?近来,国内外企业高薪寻求技术人员的招聘信息,将人工智能领域的就业热度刷新到了新高度。9月21日,全球排名第一的求职网站Indeed发布的报告显示,与GenAI相关的职位发布量和薪资水平呈现急剧上升趋势。Indeed发布《Indeed'sAIatWork》报告截止至发稿前,Indeed网站上AI职位薪资数据站长网2023-10-08 14:07:270000