Anthropic公布AI人工智能安全级别ASL系统
站长网2023-11-03 09:09:112阅
Anthropic创始人Dario Amodei在英国人工智能安全峰会上介绍了该公司提出的负责任扩张政策(Responsible Scaling Policy,RSP)。该政策旨在确保人工智能系统的安全性和可控性,防止潜在的风险和滥用。
RSP包括两个主要组成部分:ASL系统和缩放曲线。
ASL系统是模仿生物安全等级(BSL)系统设计的,每个等级都有一个相应的保障措施。ASL-1代表几乎没有风险的模型,例如下棋的专业人工智能;ASL-2代表目前所处的阶段,模型具有广泛的风险,但尚未表现出真正危险的能力;ASL-3是AI模型在CBRN(化学、生物、放射和核)领域变得具有操作危险的时候;ASL-4代表了灾难性滥用风险的升级,当AI系统接近人类水平的自主能力,或成为至少一个严重的全球安全威胁(如生物武器)的主要来源时,将触发ASL-4。
缩放曲线是用来测试这些危险能力的间隔时间,以确保不会盲目地创造出具有危险能力的模型。随着人工智能系统的规模和能力的提升,保障措施也需要相应地升级。
0002
评论列表
共(0)条相关推荐
百度:2024年Q2通过AI清理有害信息共160.4亿余条
近日,百度对外公布2024年第二季度信息安全综合治理数据。百度内容安全中心当季共计清理各类有害信息160.6亿余条。其中,通过人工智能技术挖掘并打击以淫秽色情类、赌博类等为主的相关有害信息共160.4亿余条;通过人工巡查方式打击以淫秽色情类、侵权类等为主的相关有害信息共计2435万余条。站长网2024-09-13 17:31:2900004080要大降价节奏!消息称英伟达将推RTX 4080 Ti:9499元买吗?
快科技10月7日消息,如果英伟达真的打算推出RTX4080Ti,那么RTX4080就必要要往下调价,那么其余产品势必也会跟随。其实,英伟达之前虽然取消了RTX408012GB,但是看到RTX4080不怎么受欢迎的情况后,就势必会想到推出后者的加强版,所以整活还得看老黄嘛....有消息人士表示,英伟达可能会在2024年初的时候推出RTX4080Ti,其可以看作是RTX4080的升级版。站长网2023-10-07 20:03:310000Google Play Store整顿生成式AI应用 严控不当内容传播
Google近日发布了针对AI应用程序的新指导方针,旨在减少“不适当”和“被禁止”的内容传播。根据报道,GooglePlayStore宣布了对生成式AI类应用的整顿,要求这类应用限制不当内容的传播。根据最新政策,所有提供生成式AI功能的应用必须采取有效措施,防止生成和传播色情、暴力等受限制的内容。此外,开发者需要对AI模型进行严格的测试,以确保其生成的内容符合社会道德和法律规定。站长网2024-06-08 09:51:500000学而思自主研发数学大模型 MathGPT 计划年内推出产品应用
据消息透露,学而思正在自主研发一款名为MathGPT的数学大模型,该研发项目面向全球数学爱好者和科研机构,以数学领域的解题和讲题算法为核心。目前,该项目已经取得阶段性成果,并计划于年内推出基于该自研大模型的产品级应用。站长网2023-05-05 17:36:270000pgvecto.rs:提供矢量相似性搜索的Postgres扩展
pgvecto.rs是一个Postgres扩展,提供矢量相似性搜索功能。它易于使用,并可以集成到现有的工作流程和应用程序中。pgvecto.rs是用Rust编写的,因此与类似产品相比,它具有更好的内存安全性、更好的性能和降低的维护成本。pgvecto.rs的目标是提供易于使用、高性能、安全的向量数据库解决方案。核心功能:站长网2023-08-19 15:30:540003