防止内容被抓取训练AI:百度百科屏蔽谷歌/必应等搜索引擎
站长网2024-08-22 11:09:430阅
快科技8月22日消息,据报道,近日百度百科开始屏蔽谷歌和必应等大多数搜索引擎,预计是为了阻止这些搜索引擎和其他爬虫,未经授权抓取百度百科的内容用于训练AI。
百度百科的robots.txt文件显示,目前仅有百度搜索、搜狗搜索、中国搜索(Chinaso)、YYSpider和宜搜搜索(EasouSpider)等少数几个搜索引擎被允许抓取其内容。
谷歌搜索、必应搜索、微软MSN、UC浏览器的Yisouspider以及其他一切搜索引擎爬虫均被明确禁止抓取百度百科的内容。
虽然360搜索没有在封禁列表中单独列出,但百度百科的策略是禁止一切非白名单爬虫抓取,所以360搜索和其他搜索引擎也都是被屏蔽的。
不过百度百科这种做法其实也只是防君子不防小人,肯定还有很多爬虫通过各种方式继续抓取内容然后拿去训练AI。
0000
评论列表
共(0)条相关推荐
MSU世界视频编码器大赛成绩出炉,腾讯包揽全部指标第一名
今日获悉,由莫斯科国立大学举办的MSU世界视频编码器大赛结果揭晓。在全部参赛编码器中,腾讯编码器包揽所有15项指标的全部第一,再次斩获全场最佳。MSU大赛官网比赛结果,腾讯编码器全面第一(MSUMainReport)。注:MSU比赛规则:结果差别1%以内编码器排名相同,存在并列第一。站长网2024-08-10 13:32:480000百度:正考虑和特斯拉在Robotaxi项目上开展合作
快科技5月24日消息,据媒体报道,百度自动驾驶技术部总经理徐宝强近期透露,百度正在考虑与特斯拉在Robotaxi项目上展开合作。特斯拉计划于2024年8月8日推出其无人驾驶出租车服务,而百度将根据特斯拉在中国市场的推广策略和应用模式来评估合作的可能性。特斯拉CEO埃隆马斯克在社交媒体上宣布了Robotaxi的推出计划,并提到下一代汽车平台将包括价格更亲民的汽车和全自动驾驶出租车。站长网2024-05-24 17:45:160000百度旗下小度将进军手机市场 产品5月底发布整合AI能力
据36氪消息,据百度旗下小度内部透露,该公司将进军智能手机市场,并计划在5月下旬发布旗下的第一款智能手机。该手机将整合小度AI技术能力,被称为智能手机市场的“新物种”,目前正处于发布前的最后准备阶段。据了解,目前,小度灵机大模型正在内测中。小度灵机融合了文心一言的全面能力,打造针对智能设备场景的人工智能模型,将应用到小度全系产品。站长网2023-05-08 09:56:380000叮当健康发布大模型HealthGPT及医药AI产品
叮当健康于6月28日正式发布了大模型叮当HealthGPT,并推出了基于该模型研发的应用型医药AI产品,其中包括叮当药师和营养师AI助手。叮当快药科技集团总经理杨益斌表示,GPT技术的发展与应用离不开场景、数据和技术三大要素,正是基于这三者的重要性,叮当健康开发了HealthGPT,并在此基础上推出了场景应用型产品叮当药师和营养师AI助手。站长网2023-06-29 12:13:390000OpenAI 竞争对手 Anthropic 发布第二代人工智能聊天机器人 Claude 2
Anthropic是人工智能竞赛中的新参与者。在微软支持的OpenAI和谷歌争相开发由生成式人工智能驱动的最先进聊天机器人时,Anthropic正在大举投资以保持竞争力。站长网2023-07-12 14:30:200000