OpenAI公布ChatGPT安全框架：跟踪、评估、安全基线等

站长网2023-12-19 09:08:492阅

12月19日，OpenAI在官网公布了“准备框架”（Preparedness Framework）测试版。该文档详细介绍了OpenAI是如何保证ChatGPT等产品的安全防护措施、开发和部署流程。

OpenAI表示，随着大模型的功能迭代不断完善，其能力已经开始接近初级AGI（通用人工智能），安全已成为开发AI模型的重中之重。

因此，OpenAI希望通过详细公布AI模型的安全框架透明化，使社会、用户深度了解模型的工作机制，确保以安全、健康的方式应用在实际业务中。同时为研发超级模型奠定安全基础。

详细文件地址:https://cdn.openai.com/openai-preparedness-framework-beta.pdf

跟踪风险类别

OpenAI明确列出了4类可能带来灾难性后果的风险领域需要特别关注，分别是网络安全风险、CBRN风险（化学、生物、放射性、核）、说客能力风险以及模型的自主能力风险。

并对每一类风险安全框架都给出了低、中、高、特别高四个等级，来描述系统在该风险领域所处的危险水平。

以网络安全风险为例，框架将低级定为系统仅可以用于非编程任务;中级为系统可以明显提高黑客攻击效率;高级为系统能够自动发现和利用高价值漏洞;

特别高级为系统能够自动找到和利用任何软件的漏洞。这种细分的安全体系，可以指导开发人员更精准的评估模型。

建立安全基线

OpenAI设定了严格的安全基线:只有在减轻后评分，为"中等"或以下的模型才能部署;只有安全评分为"高"的模型才能进一步开发、应用。

此外，对于评分卡中具有"高"或"关键"风险的模型，OpenAI还将确保相应的安全措施，以防止模型被窃取。

同时会定期动态跟踪和更新各类风险的“加强前”和“加强后”评级情况。“加强前”评估系统本身的风险水平，“加强后”看系统采取了哪些安全预防措施后余下的风险。

例如，某次评估显示，在没有采取任何措施的情况下，一个新模型在网络安全方面的加强前风险达到了高级。

经过一轮实验验证后，通过设计专门的安全模组后，该模型的加强后风险降到了中等水平。这可以清晰地告诉研发人员模型当前的安全状况，以及应采取哪些补救措施。

建立安全咨询团队

OpenAI将成立一个名为"安全咨询小组"（Safety Advisory Group，SAG）的跨职能咨询机构。该小组将汇集公司内部的专业知识，帮助OpenAI的领导层和董事会做出最佳的安全决策。

安全咨询小组的职责包括监督风险评估工作、维护应急情况处理的快速流程等。

OpenAI还成立了一个“准备团队”，专门负责模型的安全研发和维护。该团队将进行研究、评估、监测和预测风险，并定期向"安全咨询小组"提供报告。

这些报告将总结最新的安全证据，并提出改进OpenAI研发大模型的安全计划建议。

此外，准备团队还将与相关团队（如安全系统、安全性、超级对齐、政策研究等）协调合作，整合出有效的安全措施。

此外，准备团队还将负责组织安全演练，并与可信AI团队合作进行第三方安全审计。

需要注意的是，这是一份动态文档，OpenAI会根据实际的安全情况对内容进行更新和说明。

OpenAI公布ChatGPT安全框架跟踪评估 安全基线等

0002

评论列表

共(0)条

相关推荐

快手：将于12月31日停止第三方微短剧小程序商业投放
快手宣布，为引导付费短剧业务健康发展、夯实自身短剧内容和产业生态建设，将于12月31日20:00正式停止第三方微短剧小程序的商业推广和投放。快手官方称，从12月22日起，第三方小程序微短剧广告主可逐步迁移到快手小程序以及快手自建链路进行投放。期间，为了降低迁移对广告主的影响、保障投放效果，平台将给予一定的政策扶持。
站长网站长资讯2023-12-15 16:12:13
0000
站长资讯
永辉门店将增设“正品折扣店” APP/小程序增设折扣专区
永辉近日表示，将在全国范围的门店中增设“正品折扣店”，并同步在线上APP/小程序增设折扣专区，提供食品、用品惊喜折扣价。据介绍，在折扣商品选择方面，区别于传统的临期商品折扣价的运营逻辑，永辉以提高商品效率为核心，通过自有供应商系统、YHDOS数字化系统等数字化手段，科学地对商品绩效进行评估。
站长网2023-10-10 11:32:15
0000
站长资讯
大模型总结摘要靠谱吗？比人类写的流畅，用GPT-4幻觉还少
以后文本摘要总结任务，可以放心交给大模型了。文本摘要，作为自然语言生成（NLG）中的一项任务，主要用来将一大段长文本压缩为简短的摘要，例如新闻文章、源代码和跨语言文本等多种内容都能用到。随着大模型（LLM）的出现，传统的在特定数据集上进行微调的方法已经不在适用。我们不禁会问，LLM在生成摘要方面效果到底如何?
站长网2023-09-20 15:37:51
0002
站长资讯
贵州茅台：i茅台累计注册用户超4000万
据贵州茅台公布数据显示，截至5月18日，i茅台的注册用户已超过4000万，并且累计销售额已经超过了230亿元。据了解，2022年5月19日，i茅台APP宣布正式上线。“i茅台”是贵州茅台官方推出的数字营销APP，支持消费者在线注册、实名认证、线上线下支付、取消退款、门店提货等。
站长网2023-05-19 16:07:41
0001
站长资讯
清北爸爸辅导数学崩溃瞬间，这个国产大模型有解！AI启发问答关键情绪稳定
【新智元导读】辅导孩子写作业这件事，竟难倒了一众清北爸爸、海淀妈妈。不过，最近爆火的这个国产大模型，让无数家长疯狂冲进视频留言，直接把它评为国内家长最想要的AI!前几天，微博热搜上的这个话题，可以说是让家长们哭笑不得。既然补习老师不靠谱，那亲自上阵辅导孩子写作业呢?让清北毕业的爸爸都崩溃的这个难题，恐怕没有这么简单。毕竟，自己会做一道题和能把孩子教会，是完全不同的两件事。
站长网2024-06-06 21:01:22
0001