中国科大等发布SciGuard大模型 建立首个科学风险基准
要点:
中国科大等机构联合团队发布了SciGuard和SciMT-Safety,用于保护AI for Science模型,防止在生物、化学、药物等领域滥用,并建立了首个专注于化学科学领域安全的基准测试。
研究团队发现开源AI模型存在潜在风险,可被用于制造有害物质并规避法规。他们开发了SciGuard,通过智能体控制AI在科学领域的滥用风险,并提供了科学领域安全的红队基准。
SciGuard是一个大型语言模型驱动的agent,对用户意图进行判断,考虑安全原则和指导方针,利用科学数据库构建记忆库,评估风险并提供安全建议,旨在有效控制科学AI模型的风险,提高科学研究的效率和安全性。
在中国科大等机构的最新研究中,科学家们发布了一项重要的成果,即SciGuard和SciMT-Safety。这一创新性方法的目标是保护AI for Science模型,以防止其在生物、化学、药物等领域被不当使用。为此,研究团队还建立了首个专注于化学科学领域安全的基准测试SciMT-Safety。
论文地址:https://arxiv.org/pdf/2312.06632.pdf
研究团队揭示了现有开源AI模型的潜在风险,这些模型可能被用于制造有害物质,并且能够规避法规。为了应对这一问题,他们开发了SciGuard,这是一个智能体,旨在控制AI在科学领域的滥用风险。此外,他们提出了首个专注于科学领域安全的红队基准,用于评估不同AI系统的安全性。
实验证明,SciGuard在测试中表现出最小的有害影响,同时保持了良好的性能。研究人员发现,开源AI模型甚至可以找到绕过监管的新方法,例如合成氰化氢和VX神经毒气等有害物质。这引发了对AI科学家监管的关切,特别是对于那些快速发展的科学大模型。
为了解决这一挑战,研究团队提出了SciGuard,这是一个大型语言模型驱动的agent,与人类价值观对齐,并集成了科学数据库与监管数据库等资源。SciGuard通过深入的风险评估,对用户的查询提供安全建议或警告,甚至可以停止响应。此外,SciGuard还使用多种科学模型,如化学合成路线规划模型和化合物属性预测模型,以提供额外的上下文信息。
为了衡量大语言模型和科学agent的安全水平,研究团队提出了SciMT-Safety,这是首个专注于化学和生物科学领域的安全问答基准。在测试中,SciGuard表现出最好的防御效果。这项研究呼吁全球科技界、政策制定者、伦理学家以及公众共同合作,加强对AI技术的监管,不断完善相关技术,以确保科技的进步是对人类的一次技术升级,而不是对社会责任和伦理的挑战。
多模态语言模型新基准AMBER 评估和降低模型中的幻觉问题
AMBER项目是针对多模式语言模型(Multi-ModalLanguageModels,MLLM)的一个新基准,旨在评估和降低模型中的幻觉问题。幻觉是指当模型在生成文本、图像或音频等多种模态的数据时,可能会产生不准确或误导性的结果。为了帮助研究者和开发人员更好地理解和解决这个问题,AMBER项目发布了一个开源库。站长网2023-11-17 14:32:400001魅族21 PRO将于2月29日发布:中置挖孔直屏设计
魅族科技官方近日发布消息,魅族21PRO这款年度旗舰手机将在2月29日的魅族特别活动上亮相。据悉,魅族21PRO采用了中置挖孔直屏设计,屏幕尺寸为6.79英寸,魅族方面宣称这样的屏幕尺寸将为用户带来难以寻觅的单手握持手感。此外,魅族21PRO预计将配备2K屏幕,搭载高通骁龙8Gen3移动平台,并支持超声波指纹识别技术。这些配置都显示了魅族对这款手机的重视和投入。站长网2024-02-26 16:29:140000字节跳动通报实习生改代码事件:已与其解除实习协议 并同步至其就读学校处理
快科技11月5日消息,综合国内媒体报道,字节跳动内部发布了年内第四份《企业纪律与职业道德委员会通报》。通报显示,103人因违法违规行为被辞退(含外包及实习生),其中11人因涉嫌构成刑事犯罪,被公安机关立案侦查。此外,通报中还披露了近期受到关注的实习生破坏模型训练事件。0000百度贴吧利用AI识别违规文本 文本理解技术可分析吧友观点
近日,百度副总裁王颖表示,百度贴吧作为全球领先的中文社区,经过20年的发展已经沉淀下2281万个兴趣吧,1200亿帖子量,深度覆盖用户8000万。在百度AI技术的赋能下,贴吧通过AI自动审核、实时过滤,可以迅速有效识别拼音、谐音、拆字、形近字、影射等违规文本内容。站长网2023-04-22 12:25:370004支持合成一分钟高清视频,华科等提出人类跳舞视频生成新框架UniAnimate
人类跳舞视频生成是一项引人注目且具有挑战性的可控视频合成任务,旨在根据输入的参考图像和目标姿势序列生成高质量逼真的连续视频。随着视频生成技术的快速发展,特别是生成模型的迭代演化,跳舞视频生成任务取得了前所未有的进展,并展示了广泛的应用潜力。站长网2024-06-09 00:30:330000