中国科大等发布SciGuard大模型 建立首个科学风险基准
要点:
中国科大等机构联合团队发布了SciGuard和SciMT-Safety,用于保护AI for Science模型,防止在生物、化学、药物等领域滥用,并建立了首个专注于化学科学领域安全的基准测试。
研究团队发现开源AI模型存在潜在风险,可被用于制造有害物质并规避法规。他们开发了SciGuard,通过智能体控制AI在科学领域的滥用风险,并提供了科学领域安全的红队基准。
SciGuard是一个大型语言模型驱动的agent,对用户意图进行判断,考虑安全原则和指导方针,利用科学数据库构建记忆库,评估风险并提供安全建议,旨在有效控制科学AI模型的风险,提高科学研究的效率和安全性。
在中国科大等机构的最新研究中,科学家们发布了一项重要的成果,即SciGuard和SciMT-Safety。这一创新性方法的目标是保护AI for Science模型,以防止其在生物、化学、药物等领域被不当使用。为此,研究团队还建立了首个专注于化学科学领域安全的基准测试SciMT-Safety。
论文地址:https://arxiv.org/pdf/2312.06632.pdf
研究团队揭示了现有开源AI模型的潜在风险,这些模型可能被用于制造有害物质,并且能够规避法规。为了应对这一问题,他们开发了SciGuard,这是一个智能体,旨在控制AI在科学领域的滥用风险。此外,他们提出了首个专注于科学领域安全的红队基准,用于评估不同AI系统的安全性。
实验证明,SciGuard在测试中表现出最小的有害影响,同时保持了良好的性能。研究人员发现,开源AI模型甚至可以找到绕过监管的新方法,例如合成氰化氢和VX神经毒气等有害物质。这引发了对AI科学家监管的关切,特别是对于那些快速发展的科学大模型。
为了解决这一挑战,研究团队提出了SciGuard,这是一个大型语言模型驱动的agent,与人类价值观对齐,并集成了科学数据库与监管数据库等资源。SciGuard通过深入的风险评估,对用户的查询提供安全建议或警告,甚至可以停止响应。此外,SciGuard还使用多种科学模型,如化学合成路线规划模型和化合物属性预测模型,以提供额外的上下文信息。
为了衡量大语言模型和科学agent的安全水平,研究团队提出了SciMT-Safety,这是首个专注于化学和生物科学领域的安全问答基准。在测试中,SciGuard表现出最好的防御效果。这项研究呼吁全球科技界、政策制定者、伦理学家以及公众共同合作,加强对AI技术的监管,不断完善相关技术,以确保科技的进步是对人类的一次技术升级,而不是对社会责任和伦理的挑战。
小红书内测团购,正式布局本地生活!
谈起小红书的优势类目,很多人都会脱口而出,美妆,穿搭,护肤,但实际上这已经是老黄历了,新的优势类目是护肤,家居,母婴,教育等等,不过即便如此,还是有一个非常显著的小红书优势类目被我们忽略了,在小红书上,我们习惯叫它“探店”。站长网2023-05-11 16:13:320001人工智能芯片热潮持续,英伟达的收入增长了两倍
芯片制造商英伟达(Nvidia)当地时间周二公布的第三财季业绩超出华尔街预测,股价在盘后交易中下跌1%。但该公司称,由于出口限制影响了对其他国家的销售,下一季度将受到负面影响。Nvidia财务总监ColetteKress在致股东的信中说:「我们预计,2024财年第四季度,我们对这些目的地的销售额将大幅下降,不过我们相信,其他地区的强劲增长将足以抵消这一下降。」站长网2023-11-22 08:58:0400005亿个token之后,我们得出关于GPT的七条宝贵经验
ChatGPT正确的使用姿势。自ChatGPT问世以来,OpenAI一直被认为是全球生成式大模型的领导者。2023年3月,OpenAI官方宣布,开发者可以通过API将ChatGPT和Whisper模型集成到他们的应用程序和产品中。在GPT-4发布的同时OpenAI也开放了其API。一年过去了,OpenAI的大模型使用体验究竟如何,行业内的开发者怎么评价?0000瓜分App Store双榜,米哈游、腾讯、网易三分天下?
近日,AppStore双榜竞争颇为激烈,几乎被米哈游、腾讯、网易三分天下。根据点点数据,AppStore免费榜Top3近两日被网易产品全部包揽,分别是两款新品《逆水寒》《巅峰极速》,以及上线一年有余的《蛋仔派对》。后面紧跟腾讯的《王者荣耀》《和平精英》。站长网2023-07-04 15:58:120001图片编辑技术StableDrag发布 拖动锚点即可编辑图像同时保持高质量
还记得DragGAN吗?这是一种可以拖动锚点进行图像编辑的技术,但当时代码发布后,由于生成速度慢,且不能自定义外部图片,逐渐被人们淡忘。但现在,一种新的技术StableDrag出现了,它是基于Diffusion模型的,也能完成类似的拖动锚点编辑图片的功能。如果它的实际效果真的如演示的那样,那图片编辑将变得非常方便。站长网2024-03-11 10:00:060002