“请不要在 GitHub 上传我的代码!”
对多数程序员而言,GitHub 是一个神奇的开源社区:有丰富的学习资料、著名的项目代码,新手小白也能和编程大佬直接交流,帮别人“填坑”也能提升自我……
因此,可能很难有人料想到,有一天 GitHub 竟成为了开发者抵制的存在——今日有个开发者(以下用 “T” 代称)写的文章登上了 Hacker News 热榜,标题是:“请不要在 GitHub 上传我的代码!”
“罪魁祸首”:Copilot
说实话,看到这个标题,相信许多人的第一反应就是:GitHub 怎么了,有什么问题吗?对此,T 在文中“开门见山”地指出:“GitHub 有很多问题,其中最值得关注的,就是一个名为 Copilot 的功能。”
没错,被程序员视为“AI 编码神器”的 Copilot,就是“罪魁祸首”。
根据官方介绍,GitHub Copilot 是一个 AI 配对程序员,由 OpenAI 创建的生成预训练 AI 模型 Codex 提供支持:“可以帮助你更快地编写代码,减少工作量,从注释和代码中提取上下文,即时建议个别行代码和整个函数。”
听起来很智能,也很高效,即 AI 能帮助生成代码——但问题在于,Copilot 是如何学会编码的?
? “GitHub Copilot 经过数十亿行代码的训练,将自然语言提示转化为数十种语言的编码建议。”
?“OpenAI Codex 经过了开源代码和自然语言的培训,因此它适用于编程和人类语言……接受了公共的自然语言文本和源代码的训练,包括 GitHub 上公共存储库中的代码。”
简单来说,GitHub Copilot 确实会生成一些合适的代码,但追究其根本,其源头可能还是他人写的代码——而这,显然涉及到了代码版权问题。
绕过 GPL 协议?
有一件事需要明确:代码开源,并不意味着我们可以自由免费地用这些源代码来为所欲为,因而衍生出了许多不同的开源协议(也称开源许可证 / 开源 License,如 GPL/LGPL 等),以此规定开源代码免费使用的范围和权利。
以最为著名的开源协议 GPL 为例,其要求:只要在一个软件中使用了 GPL 协议的代码,则该软件产品必须也采用 GPL 协议,既必须也是开源和免费。
那么,问题就来了:实际上 Copilot 所学习的数十亿行开源代码,以及 GitHub 上公共存储库中的代码,其中不少都采用了 GPL 协议。而 Copilot 生成代码片段时,并不会显示原代码作者的信息,也没有提醒相关开源协议
这会导致部分遵循 GPL 协议的代码,被写入一些不开源的专有项目或商业项目中——既违反了许可证条款,也侵犯了原代码作者的知识产权。
因此,作为一名开源开发者,T 在文中呼吁:“我们已经厌倦了这种法律上的滥用,我们希望现在就停止!这也就是为什么我们要求你,作为开源社区的其他开发人员,不要在 GitHub 上传我们的代码。简而言之,我们希望保护我们的工作。”
Copilot 的争议一直未断
伴随着近几个月的AIGC热潮,MidJourney、Stable Diffusion、Copilot等生成式 AI 受到关注,但与此同时各种 AI 成果的版权问题也被推上了风口浪尖。事实上,有关 Copilot 的争议自其发布以来就一直没有断绝,其中多数围绕的都是:Copilot 生成的代码到底是原生的还是复制的?
据了解,早在 Copilot 刚发布不到一周时,就有开发者发现了 Copilot “复制代码”的实锤:Copilot 推荐的代码,还带着原代码“WTF”的注释。
此事一度在圈内引起了不小的讨论,当时便有开发者发话称,因为 Copilot严重侵犯了版权所有者的权利,以后都不会再用 GitHub 了:
因此事的过度发酵,2021年还身为 GitHub CEO 的 Nat Friedman 在推特进行了回应:
一般来说:(1)在公共数据上训练 ML 系统是合理使用(2)输出属于操作员,就像编译器一样。
我们预计在未来几年,知识产权和人工智能将成为世界各地有趣的政策讨论,而我们渴望参与其中!
不过此后,微软和 GitHub 方面再没有对 Copilot 生成代码的版权及开源许可证等争议做过任何相关处理和声明。
如今,“Copilot 会绕过 GPL 协议”,“Copilot 将开源代码变成商业作品”等说法愈演愈烈,那么作为开发者的你,对此又有什么看法呢?
参考链接:
https://nogithub.codeberg.page/
https://news.ycombinator.com/item?id=35859142
https://twitter.com/natfriedman/status/1409914420579344385
工信部:全球首个5G异网漫游试商用正式启动
据工信微报公众号消息,5月17日,在合肥举行的世界电信和信息社会日大会上,中国电信、中国移动、中国联通、中国广电联合宣布在新疆正式启动全球首个5G异网漫游试商用。据介绍,5G异网漫游是指,当所属运营商无5G网络覆盖时,用户可接入其他运营商的5G网络,继续使用5G服务。站长网2023-05-17 14:15:200000马斯克脑机接口迎来重大进展:获准进行首次人体试验
凤凰网科技讯北京时间5月26日消息,马斯克旗下脑机接口公司Neuralink周四宣布,该公司已获得美国食品和药物管理局(FDA)的批准,将启动其首个人体临床研究。这意味着,Neuralink将把他们的设备植入人类的大脑中。Neuralink已在猴子身上进行试验站长网2023-05-26 09:02:140000报告:荣耀重返中国第三季度智能手机出货量第一
今天,Canalys发布了2023年第三季度中国智能手机出货量报告。报告显示,该季度中国智能手机市场出货量同比下滑5%至6670万部。然而,荣耀凭借其产品竞争力和渠道优势,以18%的市场份额重返第一,出货量达到1180万部。站长网2023-10-26 15:36:460000《恐龙扛狼》日均获赞超百万,“我没K”到底是如何走红的?
“我没k,不嘟biu,恐龙扛狼扛狼扛,恐龙扛狼扛狼扛,恐龙扛狼扛狼扛。”近期,一首名为《恐龙扛狼》的歌曲风靡全网,歌词“我没K”也随之爆红成为网络流行词。如果你听过由港星郑秀文演唱的《眉飞色舞》,很难发现它和《恐龙扛狼》在歌词上的关联。但如果你仔细辨认其中的英文伴唱歌词,“wannamakeit,foryourwill”,便能发现其中的奥秘。站长网2023-08-14 09:27:300000AI表情包教程爆火,真能轻松变现?我们试了试
最近用AI生成表情包的教程爆火,有博主称10分钟就能搞定一套表情包,轻松赚取收益。图源:小红书表情包一直都是互联网上高频使用的一类语言表达形式,可以在聊天时传递出更多信息、情绪和态度。那么AI生成的表情包质量怎么样?我们先从网上搜集了四套表情包,你能看出以下哪些是用AI生成的吗?不卖关子,答案是全部都是用AI做的。站长网2023-05-17 17:46:160000