GPT-4等大模型更能记住版权书籍的内容 容易导致侵权和社会偏见问题
一项研究指出了当今大型语言模型的另一个潜在版权问题和文化挑战:一本书越有名和越受欢迎,语言模型就越能记住其内容。
加州大学伯克利分校的研究人员测试了ChatGPT、GPT-4和 BERT 的“背诵”能力。根据这项研究,语言模型记住了“大量受版权保护的材料”。一本书的内容在网上越受欢迎多,语言模型就越能记住其内容。

根据这项研究,OpenAI 的模型特别擅长记忆科幻小说、奇幻小说和畅销书。其中包括 《1984》、《德古拉》和《弗兰肯斯坦》等经典作品,以及《哈利波特与魔法石》等近期作品。
研究人员将谷歌的 BERT 与 ChatGPT 和 GPT-4进行了比较。“BookCorpus”是一套据称由未知作者创作的免费书籍的训练集,其中包括《丹·布朗》或《五十度灰》的作品。BERT 会记住这些书中的信息,因为这些都数据的一部分。
研究人员写道,一本书在网络上出现的次数越多,大型语言模型对它的记忆就越详细。记忆决定了语言模型执行有关一本书的下游任务的能力:一本书越为人所知,语言模型就越有可能成功地执行诸如命名出版年份或正确识别书中字符等任务。
研究人员主要关注的不是版权问题。相反,他们关心的是使用大规模语言模型进行文化分析的潜在机会和问题,特别是通俗科幻小说和奇幻作品中的共同叙事所造成的社会偏见。
文化分析研究可能会受到大规模语言模型的严重影响,并且根据培训材料中书籍的存在而产生的不同表现可能会导致研究出现偏差。
在此背景下,研究团队有一个明确的诉求:训练数据的公开。
研究人员写道,这些模型特别擅长从流行的叙述中学习,但这些叙述并不代表大多数人的经历。这一事实如何影响大规模语言模型的输出,以及它们作为文化分析工具的有用性,需要进一步研究。
此外,该团队表示,研究表明流行书籍并不是大型语言模型的良好性能测试,它们可能会表现更为出色。
魅族21手机今日开售 售价3399元起
魅族21将在今日上午10:00迎来全渠道首销,售价3399元起。魅族21搭载了最新的Flyme10.5系统,配备Aicy灵动环等设计,正面采用6.55英寸极窄四等边直屏,边框仅1.74mm。性能方面,魅族21搭载了骁龙8Gen3处理器,内置4800mAh电池,支持80W快充。影像方面,魅族21前置32MP自拍摄像头,后置200MP主摄12MP超广角5MP景深人像三摄组合。站长网2023-12-05 09:15:460000县城中产等不及加盟海底捞了
一向坚持直营模式的海底捞开放加盟了。3月4日,海底捞国际控股有限公司(06862.HK)发布公告称将推行海底捞餐厅的加盟特许经营模式,以多元经营模式进一步推动餐厅网络的扩张步伐。此外,海底捞亦已成立加盟事业部,制定加盟特许经营相关模式细节及商务合作流程。0000华为再面向全球招募天才少年 旨在发掘优秀的青少年人才
华为招聘微信公众号显示,华为再次面向全球招募天才少年。旨在发掘全球优秀的青少年人才,培养未来科技领域的精英人才,为人类社会的进步与发展做出贡献。华为公司曾表示,参赛的天才少年将有机会获得来自华为公司的专业培训和指导,接触到最前沿的科技技术和应用,参与到华为公司的全球研发和创新项目中,同时还有机会获得丰厚的奖金和荣誉。站长网2023-05-19 09:56:580000蔚来法务部:拒绝向“小牛说车”出售车辆 愿意赔付双倍定金
快科技8月5日消息,蔚来法务部今日通过官方微博发表声明,更新了部分侵害蔚来和用户权益案件的进展。其中特别提到,顾宇波利用网络账号小牛说车”侵害蔚来名誉权一案进展:合肥市中级人民法院已驳回顾宇波提出的管辖权异议上诉。同时,鉴于顾宇波对蔚来及用户进行谩骂、污蔑和攻击,官方已通知解除汽车购买协议,拒绝向其出售蔚来品牌车辆,并于解约当天退还全部款项、支付协议内涉及的双倍车辆定金。站长网2023-08-05 13:47:000000德国初创公司 Aleph Alpha 完成 5 亿美元 B 轮融资,挑战 OpenAI
德国初创公司AlephAlpha在周一宣布,已完成由博世、SAP和惠普企业等支持的5亿美元融资。这家公司构建了自己的大型语言模型,并在B轮融资中筹集了这笔新资金,这是该公司的第二轮主要融资,也是一笔不同寻常的巨额B轮投资。站长网2023-11-07 11:49:260000