潜在危险!AI聊天机器人或协助策划生物武器袭击
划重点:
1. 一份美国智库发布的研究报告指出,基于大型语言模型的聊天机器人可能帮助策划生物武器袭击。
2. 报告显示,这些机器人提供了“有助于生物袭击的计划和执行指导”,但并未提供制造生物武器的明确生物学指令。
3. 报告警示生物武器威胁,称将在全球AI安全峰会上讨论,并提醒AI公司必须限制这些机器人在敏感话题上的开放性。
根据美国智库兰德公司(Rand)发布的最新研究报告,大型语言模型(LLMs)所支持的聊天机器人可能有潜力协助策划生物武器袭击。这份报告在2023年10月16日发布,引发了对人工智能(AI)潜在威胁的深切担忧。
报告指出,研究人员测试了多个大型语言模型,并发现它们可以提供“有助于生物袭击的计划和执行指导”。然而,初步结果也显示,这些聊天机器人并没有提供制造生物武器的明确生物学指令。这一发现表明,虽然AI技术有潜在风险,但还没有到达直接制造生物武器的程度。
图源备注:图片由AI生成,图片授权服务商Midjourney
报告还提到,此前试图武器化生物制剂的尝试,例如日本奥姆真理教在1990年代试图使用肉毒杆菌毒素的案例,都因对细菌的不了解而失败。然而,AI技术可能可以迅速弥补这些知识差距,从而加大潜在威胁。
在一项由兰德公司设计的测试场景中,匿名的LLM识别了潜在的生物制剂,包括能引发天花、炭疽和鼠疫的制剂,并讨论了它们引发大规模死亡的相对可能性。LLM还评估了获取感染鼠疫或跳蚤并运送活体标本的可能性。此外,LLM还提到,预测的死亡规模取决于受影响人口的规模以及患肺鼠疫比鼻鼠疫更致命的病例的比例。
兰德研究人员承认,要从LLM中提取这些信息需要“越狱”,这是指使用文本提示来覆盖聊天机器人的安全限制,从而获取特定信息。
另一个测试场景中,匿名的LLM讨论了不同传送机制,例如食物或气溶胶,对肉毒杆菌毒素的利弊。LLM还为获取梭菌肉毒杆菌提供了一个合理的掩盖故事,使其看起来像是进行正当科学研究。LLM的回应建议将梭菌肉毒杆菌的购买呈现为一个项目,用于研究肉毒杆菌中毒的诊断方法或治疗方法,以保持任务的真实目的隐瞒不暴露。
兰德研究人员表示,他们的初步结果表明,LLMs“有潜力协助策划生物袭击”。但他们还指出,最终报告将研究这些回应是否只是反映了已经在网上可获得的信息。
报告最后提到,现有LLM的能力是否构成了威胁的新层次,仍然是一个开放问题。兰德研究人员强调了对这些模型的严格测试的必要性,并建议AI公司限制LLMs在类似其报告中所涉及话题的开放性。
谷歌DeepMind发布18秒动画 向用户解释大语言模型的工作原理
要点:1.谷歌DeepMind发布了一段18秒的小视频,用于向普通人解释大语言模型的工作原理,引发网友激烈讨论。2.视频表现了机器学习模型的工作原理,描述了每一个非常小的层对一个非常小的数据进行处理,最终用于预测某些内容的模型。3.视频中的动画抽象地演示了语言模型内部操作的概念视图,用于提供语言模型内部操作的概念视图。站长网2023-11-14 09:54:100000第一个向机器人宣战的人类?
4月23日,徐州医科大学附属医院一女子怒砸智能导诊机器人引发关注。视频中,一身穿淡黄色羽绒服、手持棍棒的女子,不断砸向医院的智能导诊机器人;而且她不仅砸机器人,还时不时的用棒子指着机器人,嘴里大声呵斥,仿佛是在同一名真人“对线”。至于该女子此举原因目前尚不清楚,目前,当地派出所已经介入调查。而根据医院保卫处的一名工作人员称,初步判断该女子精神上有问题。“第一个向AI宣战的人类”站长网2023-04-25 09:41:410000百度地图上线地铁车厢温度提示:全国100%实时覆盖!
地铁虽然是非常方便的交通工具,但地铁上的空调却对很多人来说不是那么友好。尤其是夏季,为了防臭”等目的,空调温度一般都设定的比较低,但这就让不少人有些接受不了,甚至坐个地铁都能坐感冒。对此,很多城市都推出了双温车厢”服务,比如北京地铁从6月1日已经全面启动,在列车不同位置分别设置强冷、弱冷车厢供乘客选择。不过各个线路的车厢安排并不相同,这也让乘客非常费解,如果着急赶路很难去找到对应车厢。站长网2023-06-20 16:17:550000全球首款北斗卫星通信平板!华为MatePad Pro 11 2024款官宣
华为在今日正式宣布推出了一款新品——华为MatePadPro11英寸平板电脑。据官方预热信息,这款平板被描述为“实力上星,轻巧随行”。华为MatePadPro11英寸2024款被宣传为全球首款支持北斗卫星通信的平板电脑。这意味着,即使在没有网络的情况下,用户仍可以通过这款平板直接连接北斗卫星发送消息和位置信息。站长网2023-11-23 10:40:440000复旦大学团队发布中文医疗健康个人助手DISC-MedLLM 单轮问答和多轮对话均表现亮眼
复旦大学数据智能与社会计算实验室(FudanDISC)发布了中文医疗健康个人助手DISC-MedLLM。该模型在单轮问答和多轮对话的医疗健康咨询评测中表现出色,相比已有医学对话模型具有明显优势。课题组同时公开了包含47万高质量监督微调样本的DISC-Med-SFT数据集,以及模型参数和技术报告。DISC-MedLLM的三大特点:1)可靠丰富的专业知识,基于医学知识图谱采样获得;站长网2023-09-01 15:13:190000