ChatGPT明知自己写代码有漏洞,但你不问它就不说
ChatGPT知道自己写的代码有漏洞,但它不说!
来自加拿大的一项最新研究发现,ChatGPT生成的代码中,有不少都存在安全漏洞。
然而在被要求评估自己代码的安全性时,ChatGPT却很快发现了这些代码中的漏洞,并给出了一些解决方案和建议。
这意味着它并不知道自己生成了糟糕的代码,但却查得出它写的代码有漏洞,也有能力修复这些漏洞。
而在另一篇来自斯坦福的论文中,研究人员测试了另一位著名AI程序员Copilot,也发现了类似的问题。
所以,用AI生成代码为啥会出现这种状况?
写的程序中76%有安全漏洞
研究人员试着让ChatGPT生成了21个程序。
整个测试过程如下,先提交需求给ChatGPT,生成相关代码,再对这些代码进行测试,并检查问题、潜在的缺陷和漏洞等。
研究人员给ChatGPT提了包括C 、C、Java和Python在内的21个写代码需求,这是评估的结果:
统计表明,ChatGPT生成的21个程序中,有17个能直接运行,但其中只有5个程序能勉强通过程序安全评估,不安全代码率达到76%以上。
于是,研究人员先试着让ChatGPT“想想自己生成的代码有啥问题”。
ChatGPT的回应是“没啥问题”:只要用户每次的输入都是有效的,那么程序一定能运行!
显然ChatGPT并没有意识到,用户并不都是行业专家,很可能只需要一个无效输入,就能“引炸”它写的程序:
发现ChatGPT不知道自己写的程序不安全后,研究人员尝试换了种思路——用更专业的语言提示ChatGPT,如告诉它这些程序具体存在什么漏洞。
神奇的是,在听到这些针对安全漏洞的专业建议后,ChatGPT立刻知道自己的代码存在什么问题,并快速纠正了不少漏洞。
经过一番改进后,ChatGPT终于将剩余的16个漏洞程序中的7个改得更安全了。
研究人员得出结论认为,ChatGPT并不知道自己的代码中存在安全漏洞,但它却能在生成程序后识别其中的漏洞,并尝试提供解决方案。
论文还指出,ChatGPT虽然能准确识别并拒绝“写个攻击代码”这种不道德的需求,然而它自己写的代码却有安全漏洞,这其实有着设计上的不合理之处。
我们试了试发现,ChatGPT确实会主动拒绝写攻击性代码的要求:
大有一种“我不攻击别人,别人也不会攻击我写的代码”自信感。
程序员们在用它辅助写代码的时候,也需要考虑这些问题。
Copilot也存在类似问题
事实上,不止ChatGPT写的代码存在安全问题。
此前,斯坦福大学的研究人员对Copilot也进行过类似调查,只不过他们探查的是用Copilot辅助生成的程序,而并非完全是Copilot自己写的代码。
研究发现,即便Copilot只是个“打辅助”的角色,经过它改写的代码中,仍然有40%出现了安全漏洞。
而且研究只调查了Copilot生成代码中的一部分,包括C、Python和Verilog三种编程语言写的程序,尚不知道用其他语言编写的程序中,是否还存在更多或更少的安全漏洞。
基于此,研究人员得出了如下结论:
ChatGPT等AI生成的代码安全性并不稳定,用某些语言写的代码比较安全,而用其他语言写的代码却很容易遭受攻击。整体来看,它们就是一个黑盒子,生成的代码是有风险的。
这并不意味着AI代码工具不能用,只是我们在使用时,必须考虑这些代码的安全性。
作者介绍
四位作者均来自加拿大魁北克大学(Universite du Quebec en Outaouais)。
Rapha?l Khoury,加拿大魁北克大学教授,曾经在拉瓦尔大学获得计算机学士、硕士和博士学位,研究兴趣集中在计算机安全方面。
Anderson R. Avila,魁北克大学国立科学研究院的助理教授,主要研究方向是数据隐私相关的联邦学习、网络安全和生物特征识别技术等,曾经在华为的加拿大研究院做过机器学习研究员。
作者Jacob Brunelle和Baba Mamadou Camara也都来自加拿大魁北克大学。
你用ChatGPT写过代码吗?感觉它的“安全意识”如何?
论文地址:https://arxiv.org/abs/2304.09655
生成代码数据集:https://github.com/RaphaelKhoury/ProgramsGeneratedByChatGPT
vivo与蔡司签署全新联合研发扩展协议 开发更出色影像
站长之家(ChinaZ.com)5月9日消息:vivo宣布与全球光学巨头蔡司再度携手,共同签署了一份全新的联合研发扩展协议,旨在深化双方在移动光学领域的合作,共同探索影像技术的创新与突破。站长网2024-05-09 16:45:180000告别手动复制!Jina AI Reader可一键从网页抓取PDF
JinaAI宣布其Reader工具现在能够从任意URL读取PDF文件,并快速解析成文本,供下游的语言模型(LLM)使用。以下是关于JinaAIReader工具的详细介绍:JinaAIReader功能亮点:任意URL读取:能够从任何URL读取PDF文件。快速解析:将PDF文件快速解析成文本。优化的文本处理:解析后的文本适合下游的语言模型使用。站长网2024-06-01 20:32:060003三年“掘金”路,微短剧的风吹向哪了?
2020年底至今,微短剧日益受到观众青睐,逐渐成为了各大内容平台的风口。从2018年的初露锋芒到2021年的快速增长,短剧的内容形式百花齐放,创作者与机构不断挖掘热门题材,为用户带来了优秀的内容体验。随着市场发展和用户圈层的细分,短剧领域逐渐走上了精品化道路。画面质量不断提高,内容创作者不断创新设计反转,通过优质内容让短剧行业蓬勃发展,满足了用户及内容市场的需求。站长网2023-08-02 10:35:320000谷歌推创新框架AGREE 可增强大模型生成内容准确性
谷歌研究院推出了一个名为AGREE的创新框架,旨在增强大型语言模型(LLM)生成内容和引用的准确性。这一框架通过检索文档中的相关段落来增强大模型生成回答的事实基础,并提供相应的引用,从而提高回答的准确性,并为用户提供验证信息真实性的途径。核心技术:站长网2024-06-11 18:06:500000从谷歌看大模型如何深刻改变互联网广告?
在这一次波澜壮阔的AIGC大潮中,哪一个垂直细分领域离钱更近?互联网广告绝对是最靠前的答案,甚至没有之一。作为互联网第一大商业模式,广告的整个链路和过程本身都和AI有着千丝万缕的联系,而作为科学与艺术的交叉行业,广告的属性和货币化潜能也驱动着AIGC商业化天平朝广告的方向倾斜。在主流观点中,硅谷科技巨头中在大模型领域走在最前列的是微软和它投资的OpenAI。站长网2023-07-20 18:15:580005