擅自收集图片数据!AI抓取工具img2dataset困扰着图片网站
img2dataset是一款自动在互联网上搜索图像数据并用训练于人工智能图像生成器的免费工具,不过这款工具引发了网站所有者的担忧。
网站所有者认为这款工具将擅自获取他们的图像和数据,而不是经过许可,希望img2dataset停止抓取行为的做法。对此,这款工具的创建者罗曼·博蒙特(Romain Beaumont)在其GitHub表示,他们(网站拥有者)正在与人工智能不可避免的崛起作斗争,这是“可悲的”。“令人难过的是,你们中的一些人不了解人工智能和开放人工智能的潜力,因此决定与之斗争。”“在未来的几年里,你将有很多机会从人工智能中受益。我希望你尽早看到这一点。作为创作者,你有更多的机会从中受益。”

Img2dataset是博蒙特在GitHub上共享的免费工具,允许用户自动下载和调整URL列表,从而获得图像数据集,这种数据集训练图像生成人工智能模型,如OpenAI的DALL-E,开源的Stable Diffusion和谷歌的Imagen。
博蒙特还是LAION-5B的开源贡献者,LAION-5B是世界上最大的图像数据集之一,包含超过50亿张图像,供给Imagen和Stable Diffusion使用。
Img2dataset会尝试从任何网站抓取图像,除非网站所有者添加https头,如“X-Robots-Tag: noai”和“X-Robots-Tag: noindex”。这意味着网站所有者可以选择”阻止“img2dataset,不过他们中的许多人可能甚至不知道img2dataset的存在。
博蒙特为img2dataset辩护,将该工具与Google索引网站的方式进行比较,称谷歌索引方式对任何想搜索互联网的人都有好处。
对此有专家认为,网站所有者是直接受益于搜索引擎,因为它们为网站带来了有用的流量。谷歌的机器人是有原则的,不会攻击网站,大多数机器人都尊重robots.txt指令。而Img2dataset则没有,该工具似乎是故意设忽视网站所有者的指令。坦率地说,它并没有给网站所有者带来任何直接好处。
毫无疑问,Img2dataset这款AI工具引起了网站所有者的担忧,他们担心他们的敏感数据和隐私正在被侵犯,如果AI技术的发展不受控制,很容易操纵大量的数据。
img2dataset项目网址:https://github.com/rom1504/img2dataset
极兔速递正式在港交所上市 市值超1000亿港元
10月27日,极兔速递正式在港交所主板挂牌上市,股份代号为1519.HK,每股12港元,市值超1000亿港元。极兔速递表示,此次发售募集资金净额约35.3亿港元,约30%用于拓宽物流网络、升级基础设施和强化分拣及仓储能力,约30%用于开拓新市场及扩大服务范围,约30%用于研发及技术创新,约10%用于一般企业目的及运营资金需求。站长网2023-10-27 10:38:570000NVIDIA RTX 5000 Ada工作站显卡现身国内电商:32GB显存 价格35999元
快科技9月29日消息,NVIDIA在8月份发布的RTX5000/6000ADA工作站专业卡,如今终于在国内电商上架了。不过价格不美丽,售价来到了35999元。据了解,在规格上RTX5000ADA采用了AD102核心,12800个CUDA核心、400个Tensor核心、100个第三代RT核心。显存为256-bit32GB,频率18GHz,578GB/s的带宽,功耗仅有250W。站长网2023-09-30 09:00:230000Lightricks发布LongAnimatediff 解决单次生成视频长度问题
Lightricks公司最近发布了LongAnimatediff项目,这一次主要解决的问题是Animatediff一次只能生成16帧视频的限制。而LongAnimatediff则包括两个模型,一个可以最多一次生成64帧的视频,另一个可以生成32帧的视频,而且32帧那个效果更好。站长网2023-12-25 17:39:350000Opera浏览器推出升级版的AI工具Aria
要点:1.Opera浏览器推出升级版的AI工具Aria,使用户能够更轻松地与AI互动,优化查询和创作内容。2.Aria的新工具“Refiner”具备“重用”和“改述”功能,用户可以根据以前的回答元素来改进AI的回应。3.用户还可以使用Aria的“高亮器”功能来标记需要后续处理的元素,以及通过“我的风格”功能训练AI以模仿其写作风格。站长网2023-10-11 16:41:260000真假“长文本”,国产大模型混战
Kimi有多火爆?凭一己之力搅乱A股和大模型圈。Kimi概念股连日引爆资本市场,多个概念股随之涨停。在一片看好的态势中,谁都想来沾个边,据光锥智能不完全统计,目前,至少有包括读客文化、掌阅科技、万兴科技等在内的十家上市公司发布公告透露正在了解或接入了Kimi智能助手。眼看着Kimi的火越烧越旺,大厂也垂涎三尺,连夜加入了大模型“长文本”的四国大战。站长网2024-03-26 17:37:320000