谷歌和OpenAI呼吁修改版权法以获取AI训练数据
本文概要:
1. Google 和 OpenAI 利用他们的机器人(GoogleBot 和 GPTBot)从互联网上收集数据,但最近的版权法对他们的数据抓取工作提出了障碍。
2. AI 模型需要人类生成的内容来提高,但公司应该支付还是从互联网获取这些内容是一个问题。
3. OpenAI 已经开始使用由 ChatGPT 创建的数据集来训练 GPT-4,但仅依赖这些数据可能导致模型崩溃。
Google 和 OpenAI 正面临着版权法在其 AI 训练数据收集方面的限制。随着 ChatGPT 和 Google 的 Bard 等生成式 AI 系统的普及,对更多数据的需求不断增长。
这些AI系统需要大量的文本、图像和视频进行训练。OpenAI 强调 GPT-4是通过经过批准和公开可用的数据源进行学习的。然而,由于对互联网抓取数据的担忧,OpenAI 和 Google 在数据获取方面面临公众的反对。
提高 AI 模型的质量需要人类生成的内容,而问题在于公司是否应该为这些内容付费或者从互联网上获取。未来,人类生成的内容可能以高价销售。
OpenAI 最近开始使用由 ChatGPT 创建的数据集来训练 GPT-4,但仅仅依赖这些数据可能导致模型崩溃。这种情况发生在模型从其他模型生成的数据中学习,导致失去准确的数据。此外,未经作者同意或未给予作者名字的使用作品也成为了讨论的话题。上个月,数千名作者签署请愿书,要求 AI 公司停止未经许可使用他们的作品。
目前,OpenAI 和 Google 都把决定是否允许生成式 AI 挖掘他们的内容的责任放在出版商身上。Google 建议创建一个类似于 robots.txt 系统的社区开发标准,允许出版商选择拒绝抓取他们的作品被。
OpenAI 已经采取了初步措施,通过将其添加到网站的 robot.txt 文件中,让网站所有者选择不让 GPTBot 访问。OpenAI 还与美联社合作,以获取实时数据进行未来的模型训练,并寻求避免法律纠纷并补偿创作者。
美国对谷歌发起重大反垄断诉讼 质疑其搜索引擎主导地位
美国司法部最近对谷歌发起了一场可能具有里程碑意义的反垄断诉讼。案件于本周一在华盛顿特区联邦法院开庭。根据司法部的指控,谷歌与苹果等公司达成反竞争协议,以巩固其搜索引擎的主导地位。而谷歌则声称,其在搜索市场上的主导地位是由于提供优质产品和服务所致。站长网2023-10-31 09:25:320000首个 AI增强社交网络来了!这个APP让「虚假性」发挥到极致
近日,一款名为“BeFake”的新应用推出,它被称为真人社交应用“BeReal”的“反面教材”。BeReal去年风靡AppStore,它要求用户在随机时间拍摄自拍和环境照,展示真实生活中的平凡一刻。而BeFake则恰恰相反,它让用户编辑虚假的照片,呈现出更精彩的“假”生活。站长网2023-09-18 10:46:190000小米汽车:7月交付量继续破万台 11月提前完成全年十万交付目标
小米汽车在2024年7月取得了令人瞩目的成绩,其SU7车型的交付量超过了10000台。公司预计8月份的交付量将继续保持这一势头,并有望在11月提前完成全年10万台的交付目标。在上月举行的"2024雷军年度演讲"中,雷军已经宣布,预计11月将提前完成全年10万辆的交付目标,这显示了小米汽车在市场上的强劲表现。站长网2024-08-01 11:30:420000OpenAI 董事会正在与 Sam Altman 就重返 CEO 岗位进行讨论
站长之家(ChinaZ.com)11月20日消息:根据多位熟悉此事的人士透露,OpenAI董事会目前正在与SamAltman讨论,以让他重返公司担任首席执行官(CEO)。据了解,Altman上周五突然被董事会无预警解职后,对于重返公司持「矛盾」态度,并希望进行重大治理变革。站长网2023-11-20 08:54:540000