中国科大等发布SciGuard大模型 建立首个科学风险基准
要点:
中国科大等机构联合团队发布了SciGuard和SciMT-Safety,用于保护AI for Science模型,防止在生物、化学、药物等领域滥用,并建立了首个专注于化学科学领域安全的基准测试。
研究团队发现开源AI模型存在潜在风险,可被用于制造有害物质并规避法规。他们开发了SciGuard,通过智能体控制AI在科学领域的滥用风险,并提供了科学领域安全的红队基准。
SciGuard是一个大型语言模型驱动的agent,对用户意图进行判断,考虑安全原则和指导方针,利用科学数据库构建记忆库,评估风险并提供安全建议,旨在有效控制科学AI模型的风险,提高科学研究的效率和安全性。
在中国科大等机构的最新研究中,科学家们发布了一项重要的成果,即SciGuard和SciMT-Safety。这一创新性方法的目标是保护AI for Science模型,以防止其在生物、化学、药物等领域被不当使用。为此,研究团队还建立了首个专注于化学科学领域安全的基准测试SciMT-Safety。

论文地址:https://arxiv.org/pdf/2312.06632.pdf
研究团队揭示了现有开源AI模型的潜在风险,这些模型可能被用于制造有害物质,并且能够规避法规。为了应对这一问题,他们开发了SciGuard,这是一个智能体,旨在控制AI在科学领域的滥用风险。此外,他们提出了首个专注于科学领域安全的红队基准,用于评估不同AI系统的安全性。
实验证明,SciGuard在测试中表现出最小的有害影响,同时保持了良好的性能。研究人员发现,开源AI模型甚至可以找到绕过监管的新方法,例如合成氰化氢和VX神经毒气等有害物质。这引发了对AI科学家监管的关切,特别是对于那些快速发展的科学大模型。
为了解决这一挑战,研究团队提出了SciGuard,这是一个大型语言模型驱动的agent,与人类价值观对齐,并集成了科学数据库与监管数据库等资源。SciGuard通过深入的风险评估,对用户的查询提供安全建议或警告,甚至可以停止响应。此外,SciGuard还使用多种科学模型,如化学合成路线规划模型和化合物属性预测模型,以提供额外的上下文信息。
为了衡量大语言模型和科学agent的安全水平,研究团队提出了SciMT-Safety,这是首个专注于化学和生物科学领域的安全问答基准。在测试中,SciGuard表现出最好的防御效果。这项研究呼吁全球科技界、政策制定者、伦理学家以及公众共同合作,加强对AI技术的监管,不断完善相关技术,以确保科技的进步是对人类的一次技术升级,而不是对社会责任和伦理的挑战。
英国 AI 领域预计在预算中获得额外1亿英镑资金支持
划重点:-💰财政部计划为英国不断增长的人工智能领域提供财政支持,通过加倍资助艾伦・图灵研究所来实现-🏥额外资金将用于AI在改变医疗保健、保护环境以及加强国防和国家安全方面的研究-🌍英国希望借助科技革命推动经济增长,并使研究人员在医学、航空航天和气候变化等领域取得新的发现0000谷歌增强 Android 系统的恶意软件防御能力 以应对利用人工智能等方法绕过检测行为
站长之家(ChinaZ.com)10月19日消息:GooglePlay商店可能并不适合阻止Android恶意软件,但其比未经过滤的互联网安全得多。谷歌围墙花园之外的世界根本没有规则,并且提供了无数可用于侧载的可疑应用程序。站长网2023-10-19 08:55:010003全网下架、禁止投流:短剧行业“急刹车”
近日,咪蒙团队制作的四部短剧被全网下架的消息,成功将短剧这一炙手可热的赛道再次推上风口浪尖。因为情节紧凑、反转多、爽感强,短剧自诞生起就极具吸睛力和吸粉力,不少短视频用户早已成为短剧内容的忠实粉丝。流量聚集之地自然也能“掘金”,今年下半年以来,越来越多的短剧创造了“万元制作,亿元回报”的财富神话。站长网2023-12-20 20:59:080000AMIE:用于诊断医学推理和对话的人工智能系统
AMIE是由Google开发的人工智能系统,专注于诊断医学推理和对话。其主要能力包括帮助诊断病情、与医生患者进行自然对话、不断学习和进步、提高诊断准确性以及评估医生的沟通技巧。详细介绍:https://blog.research.google/2024/01/amie-research-ai-system-for-diagnostic_12.html站长网2024-01-17 14:48:320000周鸿祎透露360大模型安全解决方案 将推 Agent框架
文章概要:1.360公司创始人周鸿祎在计算机安全学术交流会上介绍了360大模型安全解决方案,着重解决大模型的安全挑战。2.安全风险分为短期、中期、长期三个阶段,涉及网络安全、数据安全、生成内容安全等问题,以及人为恶意应用和更强大人工智能对安全的长期挑战。3.360将推出Agent框架,将人的能力赋予大模型,同时构建原生安全大模型“360智脑”来确保大模型在企业级场景中安全应用。站长网2023-10-14 10:55:440000