谷歌和OpenAI呼吁修改版权法以获取AI训练数据
本文概要:
1. Google 和 OpenAI 利用他们的机器人(GoogleBot 和 GPTBot)从互联网上收集数据,但最近的版权法对他们的数据抓取工作提出了障碍。
2. AI 模型需要人类生成的内容来提高,但公司应该支付还是从互联网获取这些内容是一个问题。
3. OpenAI 已经开始使用由 ChatGPT 创建的数据集来训练 GPT-4,但仅依赖这些数据可能导致模型崩溃。
Google 和 OpenAI 正面临着版权法在其 AI 训练数据收集方面的限制。随着 ChatGPT 和 Google 的 Bard 等生成式 AI 系统的普及,对更多数据的需求不断增长。
这些AI系统需要大量的文本、图像和视频进行训练。OpenAI 强调 GPT-4是通过经过批准和公开可用的数据源进行学习的。然而,由于对互联网抓取数据的担忧,OpenAI 和 Google 在数据获取方面面临公众的反对。
提高 AI 模型的质量需要人类生成的内容,而问题在于公司是否应该为这些内容付费或者从互联网上获取。未来,人类生成的内容可能以高价销售。
OpenAI 最近开始使用由 ChatGPT 创建的数据集来训练 GPT-4,但仅仅依赖这些数据可能导致模型崩溃。这种情况发生在模型从其他模型生成的数据中学习,导致失去准确的数据。此外,未经作者同意或未给予作者名字的使用作品也成为了讨论的话题。上个月,数千名作者签署请愿书,要求 AI 公司停止未经许可使用他们的作品。
目前,OpenAI 和 Google 都把决定是否允许生成式 AI 挖掘他们的内容的责任放在出版商身上。Google 建议创建一个类似于 robots.txt 系统的社区开发标准,允许出版商选择拒绝抓取他们的作品被。
OpenAI 已经采取了初步措施,通过将其添加到网站的 robot.txt 文件中,让网站所有者选择不让 GPTBot 访问。OpenAI 还与美联社合作,以获取实时数据进行未来的模型训练,并寻求避免法律纠纷并补偿创作者。
IBM 为美国网球公开赛提供AI生成的评论和抽签分析
文章概要:1.IBM使用Watsonx的人工智能为美网提供生成式网球评论和分析。2.IBM首次为单打抽签中的每场比赛生成详尽的音频评论和字幕。3.IBM还首次推出了AI支持的抽签分析,预测单打抽签中所有球员的优势或劣势。美国网球公开赛正在举行,IBM作为技术合作伙伴,在本届赛事中首次大规模应用人工智能技术。站长网2023-08-31 11:04:470000谷歌DeepMind最新研究:对抗性攻击对人类也有效,人类和AI都会把花瓶认成猫!
【新智元导读】神经网络由于自身的特点而容易受到对抗性攻击,然而,谷歌DeepMind的最新研究表明,我们人类的判断也会受到这种对抗性扰动的影响人类的神经网络(大脑)和人工神经网络(ANN)的关系是什么?有位老师曾经这样比喻:就像是老鼠和米老鼠的关系。现实中的神经网络功能强大,但与人类的感知、学习和理解方式完全不同。比如ANN表现出人类感知中通常没有的脆弱性,它们容易受到对抗性扰动的影响。0000最强“全开源”多模态分割一切大模型APE
要点:1、APE是一种全开源的多模态分割模型,通过独立建模每个类别名实例、压缩Word-LevelEmbeddings为Sentence-LevelEmbeddings、采用不同的特征融合方式以及统一前景和背景粒度来提高分割效果。站长网2023-12-10 10:13:430001用活人脑细胞构建AI系统,语音识别准确率提升至78%
要点:1、用活人脑细胞构建AI系统,语音识别准确率大幅提升;2、新型系统可以进行无监督学习,并具有类似神经网络的功能;3、系统的学习能力取决于脑类器官中神经细胞之间的连接。0000淄博烧烤热下的加盟启示录
在微信运动的记录中,李彦最近每个周末都要走20000步,他并非运动爱好者,而是在精心挑选周边的店铺。“今年经济恢复还不错,但我时间不富裕,就想加盟个品牌,但店铺得自己跑。”每个周末,李彦都日行万步,结合自己地产行业累积的资源和知识,评估起店铺的位置、人流以及周边人群的消费水平。而加盟品牌能够吸引像李彦这样普通打工人的还不止这些,想要兼职创业的张可,最近在选择项目时,着实被震惊到了。站长网2023-05-12 20:38:100000