GPT-3.5模型输出被检测出高达60%含抄袭内容
抄袭检测器 Copyleaks 的一份报告显示,OpenAI 的 GPT-3.5输出中有60% 包含某种形式的抄袭。该公司使用了一种专有的评分方法,考虑相同的文本、微小的改动、释义等来分配“相似性分数”。
据悉,Copyleaks 专注于基于人工智能的文本分析,并为企业和学校提供抄袭检测工具。该公司早在 ChatGPT 之前就已经涉足这一领域。尽管 GPT-3.5是 ChatGPT 首次亮相的明星,但 OpenAI 此后已升级到更先进的 GPT-4。
根据他们的最新发现,GPT-3.5表现出45.7% 的相同文本、27.4% 的微小变化和46.5% 的释义文本。根据报告,0% 意味着完全原创,而100% 则表明没有原创内容。
图源备注:图片由AI生成,图片授权服务商Midjourney
Copyleaks 对 GPT-3.5进行了各种测试,生成了大约1000个输出,每个输出大约400个单词,涉及26个主题。相似度得分最高的结果属于计算机科学(100%),其次是物理学(92%)和心理学(88%)。另一方面,戏剧(0.9%)、人文学科(2.8%)和英语(5.4%)的相似度得分最低。
OpenAI 发言人 Lindsey Held 告诉Axios:“我们的模型经过设计和训练来学习概念,以帮助他们解决新问题。”“我们制定了措施来限制无意的记忆,并且我们的使用条款禁止故意使用我们的模型来反省内容。”
剽窃不仅仅是剪切和粘贴整个句子和段落。《纽约时报》对 OpenAI提起诉讼,称 OpenAI 的 AI 系统“大规模复制”构成版权侵权。OpenAI对诉讼作出回应,称“反流”是一种“罕见的错误”,并指责《纽约时报》“操纵提示”。
内容创作者试图辩称,生成AI模型是在他们的作品上训练的,所以产出近似副本不应构成侵权。但目前相关法律裁决多支持公司而非创作者。纽约时报诉讼一案让人看到希望,但结果仍未明朗。
Midjourney 升级 GPU 集群 提高图片生成速度
Midjourney今天宣布进行了GPU集群的升级。升级后,Pro和Mega级别的订阅用户将获得1.5倍的加速效果,图片生成时间将从约50秒缩短到30秒左右。此外,渲染的成本也将随之降低。站长网2023-08-11 16:35:460000我用AI卖废料,平台上线两年,成交3亿+美金 | 对话创始人
5月份的一个上午,通过谷歌出海加速器的引荐,我们认识了「再生博士」的创始人兼CEO谭天、以及此前我们从未了解过的全球废料回收行业。用谭天的话来说,这是一个暴利的冷门行业,很少被人关注,极强的信息壁垒让这个行业一直类似于“小农经济”在运行,而他希望借助于AI,把废料回收带入“工业经济”模式,让现在全球只被回收了不到20%的废料,再利用的比例再提升一些(尽可能提升到100%)。站长网2023-06-06 19:07:280001报告:百度智能云位居中国人工智能基础数据服务市场份额第一
近日,专业咨询服务机构德勤发布《2022年人工智能基础数据服务白皮书》。白皮书显示,百度智能云位居人工智能基础数据服务市场份额第一,市场占有率近18%。站长网2023-04-13 08:43:370000ChatGPT 发布一周年: OpenAI 的人工智能聊天机器人是如何彻底改变科技界的?
站长之家(ChinaZ.com)12月1日消息:OpenAI于一年前的今天(2022年11月30日)推出的ChatGPT,可能成为现代科技时代最低调的游戏规则改变者。没有人在登台上宣布他们发明了未来,也没有人认为他们推出的产品会让他们致富。站长网2023-12-01 09:19:380000互联网时代下 AI 与人类创造力的角逐:当 AI 向 AI 生成数据学习时「模型崩溃」将引发混乱
在大型语言模型(LLM)越来越多地依赖于ChatGPT和其他工具来提高效率的情况下,我们可以预见到未来很大一部分网络内容将由人工智能生成。然而,这可能对大型语言模型的未来构成严重风险,因为目前它们依赖于从网络上抓取的人类生成数据。站长网2023-06-15 12:26:520002