设为首页
收藏本站
开启辅助访问
全部
问与答
创意
技术
酷工作
生活
交易
节点
飞墙
Follow
明白贴
工算小助手
登录
注册
飞社-令人惊奇的创意工作者社区-
›
首页
›
程序员
›
网站根目录下设置的 robots.txt 规则现在爬虫机器人不遵 ...
FSHEX=FIND+SHARE+EXPRESS
飞社-令人惊奇的创意工作者社区- 是一个关于发现分享表达的地方
现在登录
没有账号?
立即注册
推荐主题
›
奶茶店的奶茶到底健康吗?
›
「第一份工作决定了整个职业生涯」是真的吗
›
微信利用垄断地位作恶
›
成都 2026 年房价走势
›
上海移动新套路 qos,官方测速正常,实际限
今日热议主题
携程高铁/火车 抢票 会 比 官方途径老实候
有这样一个窒息的父亲怎么办
Google 杀死 XSLT 后,你的博客订阅源还能
openMemory 不太好用,我做了个加强版
✨ [出] 3 个一样字母, 4 位的美妙域名。
深圳收几个京东家政
放假了 老铁们都准备玩啥手游?
对于从来没看过书的人,第一本该读什么书?
突然扣走一笔 22.73?怎么办??
Claude Code Agent Teams 原理机制深度解析
显示全部
|
最新评论
16 条回复
·
1860 次点击
11#
laobaiguolai
初学
2025-10-17 10:06:42
用的 cloudflare ,他们家的识别和阻止能力还是可以的
12#
opengps
初学
2025-10-17 10:07:22
我最近刚好做了相关的,搜索引擎的爬虫,至少人家 UA 是明确的,虽然可以轻松伪造,但如果你不想,可以从 UA 入手拦截官方的爬虫。(按伦理来讲,至少官方的爬虫不至于明目张胆伪造 UA )。 顺便附赠几个最近关注到的 主要的 AI 爬虫 UA 关键字:"mj12bot","openai","gptbot","claudebot","semrushbot","siteauditbot"
13#
charles0
初学
2025-10-17 10:33:10
还有伪装 UA 的爬虫呢,要解决可以试试 Cloudflare 或 https://anubis.techaro.lol/
14#
ZeroClover
小成
2025-10-17 11:44:05
你发的日志里面 GPTBot 都是假的,和官方公布的 IP 对不上 https://platform.openai.com/docs/bots
15#
edak
初学
2025-10-17 12:06:20
君子协议
16#
Ketteiron
初学
2025-10-17 12:17:19
有挂 waf 吗,现在一个小网站/博客都没几个活人看,却被几百个 bot 轮番轰炸
17#
shinciao
初学
2025-10-17 13:05:55
现在 AI 的爬虫会访问除了 robots.txt 之外的所有文件
1
2
/ 2 页
返回顶部