中国科大等发布SciGuard大模型建立首个科学风险基准

站长网2023-12-18 14:32:230阅

要点:

中国科大等机构联合团队发布了SciGuard和SciMT-Safety，用于保护AI for Science模型，防止在生物、化学、药物等领域滥用，并建立了首个专注于化学科学领域安全的基准测试。

研究团队发现开源AI模型存在潜在风险，可被用于制造有害物质并规避法规。他们开发了SciGuard，通过智能体控制AI在科学领域的滥用风险，并提供了科学领域安全的红队基准。

SciGuard是一个大型语言模型驱动的agent，对用户意图进行判断，考虑安全原则和指导方针，利用科学数据库构建记忆库，评估风险并提供安全建议，旨在有效控制科学AI模型的风险，提高科学研究的效率和安全性。

在中国科大等机构的最新研究中，科学家们发布了一项重要的成果，即SciGuard和SciMT-Safety。这一创新性方法的目标是保护AI for Science模型，以防止其在生物、化学、药物等领域被不当使用。为此，研究团队还建立了首个专注于化学科学领域安全的基准测试SciMT-Safety。

论文地址:https://arxiv.org/pdf/2312.06632.pdf

研究团队揭示了现有开源AI模型的潜在风险，这些模型可能被用于制造有害物质，并且能够规避法规。为了应对这一问题，他们开发了SciGuard，这是一个智能体，旨在控制AI在科学领域的滥用风险。此外，他们提出了首个专注于科学领域安全的红队基准，用于评估不同AI系统的安全性。

实验证明，SciGuard在测试中表现出最小的有害影响，同时保持了良好的性能。研究人员发现，开源AI模型甚至可以找到绕过监管的新方法，例如合成氰化氢和VX神经毒气等有害物质。这引发了对AI科学家监管的关切，特别是对于那些快速发展的科学大模型。

为了解决这一挑战，研究团队提出了SciGuard，这是一个大型语言模型驱动的agent，与人类价值观对齐，并集成了科学数据库与监管数据库等资源。SciGuard通过深入的风险评估，对用户的查询提供安全建议或警告，甚至可以停止响应。此外，SciGuard还使用多种科学模型，如化学合成路线规划模型和化合物属性预测模型，以提供额外的上下文信息。

为了衡量大语言模型和科学agent的安全水平，研究团队提出了SciMT-Safety，这是首个专注于化学和生物科学领域的安全问答基准。在测试中，SciGuard表现出最好的防御效果。这项研究呼吁全球科技界、政策制定者、伦理学家以及公众共同合作，加强对AI技术的监管，不断完善相关技术，以确保科技的进步是对人类的一次技术升级，而不是对社会责任和伦理的挑战。

中国科大等发布SciGuard大模型建立首个科学风险基准

0000

评论列表

共(0)条

相关推荐

英国 AI 领域预计在预算中获得额外1亿英镑资金支持
划重点:-💰财政部计划为英国不断增长的人工智能领域提供财政支持，通过加倍资助艾伦・图灵研究所来实现-🏥额外资金将用于AI在改变医疗保健、保护环境以及加强国防和国家安全方面的研究-🌍英国希望借助科技革命推动经济增长，并使研究人员在医学、航空航天和气候变化等领域取得新的发现
站长网站长资讯2024-03-05 12:45:20
0000
站长资讯
谷歌增强 Android 系统的恶意软件防御能力以应对利用人工智能等方法绕过检测行为
站长之家(ChinaZ.com)10月19日消息:GooglePlay商店可能并不适合阻止Android恶意软件，但其比未经过滤的互联网安全得多。谷歌围墙花园之外的世界根本没有规则，并且提供了无数可用于侧载的可疑应用程序。
站长网2023-10-19 08:55:01
0003
站长资讯
全网下架、禁止投流：短剧行业“急刹车”
近日，咪蒙团队制作的四部短剧被全网下架的消息，成功将短剧这一炙手可热的赛道再次推上风口浪尖。因为情节紧凑、反转多、爽感强，短剧自诞生起就极具吸睛力和吸粉力，不少短视频用户早已成为短剧内容的忠实粉丝。流量聚集之地自然也能“掘金”，今年下半年以来，越来越多的短剧创造了“万元制作，亿元回报”的财富神话。
站长网2023-12-20 20:59:08
0000
站长资讯
AMIE：用于诊断医学推理和对话的人工智能系统
AMIE是由Google开发的人工智能系统，专注于诊断医学推理和对话。其主要能力包括帮助诊断病情、与医生患者进行自然对话、不断学习和进步、提高诊断准确性以及评估医生的沟通技巧。详细介绍:https://blog.research.google/2024/01/amie-research-ai-system-for-diagnostic_12.html
站长网2024-01-17 14:48:32
0000
站长资讯
周鸿祎透露360大模型安全解决方案将推 Agent框架
文章概要:1.360公司创始人周鸿祎在计算机安全学术交流会上介绍了360大模型安全解决方案，着重解决大模型的安全挑战。2.安全风险分为短期、中期、长期三个阶段，涉及网络安全、数据安全、生成内容安全等问题，以及人为恶意应用和更强大人工智能对安全的长期挑战。3.360将推出Agent框架，将人的能力赋予大模型，同时构建原生安全大模型“360智脑”来确保大模型在企业级场景中安全应用。
站长网2023-10-14 10:55:44
0000