防止内容被抓取训练AI:百度百科屏蔽谷歌/必应等搜索引擎

[复制链接]
周大 发表于 2024-8-22 15:01:48 | 显示全部楼层 |阅读模式
百度百科近期更新了其robots.txt文件,开始屏蔽谷歌、必应等大多数搜索引擎的爬虫,仅允许百度搜索、搜狗搜索等少数搜索引擎访问其内容。这一举措旨在防止未经授权的抓取行为用于AI训练。尽管360搜索未在封禁列表中,但由于默认禁止非白名单爬虫,实际上也被屏蔽。然而,这种方法可能只能限制合法爬虫,难以完全阻止内容被抓取。
来源:https://tech.ifeng.com/c/8cFdsd8yDPe

Archiver|手机版|靠浦网络|靠浦ai课堂 ( 鄂ICP备17024134号-3 )

GMT+8, 2025-5-18 18:01 , Processed in 0.292837 second(s), 23 queries .

Powered by Discuz! X3.5

© 2001-2025 Discuz! Team.

快速回复 返回顶部 返回列表