设为首页
收藏本站
开启辅助访问
全部
问与答
创意
技术
酷工作
生活
交易
资源
节点
飞墙
Follow
明白贴
报酬
登录
注册
飞社-令人惊奇的创意工作者社区-
›
首页
›
程序员
›
网站根目录下设置的 robots.txt 规则现在爬虫机器人不遵 ...
FSHEX=FIND+SHARE+EXPRESS
飞社-令人惊奇的创意工作者社区- 是一个关于发现分享表达的地方
现在登录
没有账号?
立即注册
推荐主题
›
我这周不想通勤回去了,但是心里又很内疚咋
›
giffgaff 流量注册了两个 gmail,基本上是注
›
本以为国产安卓这几年发展替代苹果没啥大问
›
115 历史跑路事迹整理
›
求点评一下装机配置
今日热议主题
通过中转 apikey 使用 cc 的/chrome 功能登
android 是否有可以语音添加待办事项的 app
探讨:动态未知环境下,基于单设备异构传感
硬核 | 智谱上市招股书深度解读
请教,什么 IDE 看内核代码比较好?能否满
微星魔龙 4060ti 显卡 省流 2000
买二手无锁 esim 果机,挂外区 ID 被风控后
奈飞小铺又又又跑路了?
收 iPhone 16pro 或 16pm
怎样算是一个合格的 CTO?
显示全部
|
最新评论
16 条回复
·
1834 次点击
11#
laobaiguolai
初学
2025-10-17 10:06:42
用的 cloudflare ,他们家的识别和阻止能力还是可以的
12#
opengps
初学
2025-10-17 10:07:22
我最近刚好做了相关的,搜索引擎的爬虫,至少人家 UA 是明确的,虽然可以轻松伪造,但如果你不想,可以从 UA 入手拦截官方的爬虫。(按伦理来讲,至少官方的爬虫不至于明目张胆伪造 UA )。 顺便附赠几个最近关注到的 主要的 AI 爬虫 UA 关键字:"mj12bot","openai","gptbot","claudebot","semrushbot","siteauditbot"
13#
charles0
初学
2025-10-17 10:33:10
还有伪装 UA 的爬虫呢,要解决可以试试 Cloudflare 或 https://anubis.techaro.lol/
14#
ZeroClover
小成
2025-10-17 11:44:05
你发的日志里面 GPTBot 都是假的,和官方公布的 IP 对不上 https://platform.openai.com/docs/bots
15#
edak
初学
2025-10-17 12:06:20
君子协议
16#
Ketteiron
初学
2025-10-17 12:17:19
有挂 waf 吗,现在一个小网站/博客都没几个活人看,却被几百个 bot 轮番轰炸
17#
shinciao
初学
2025-10-17 13:05:55
现在 AI 的爬虫会访问除了 robots.txt 之外的所有文件
1
2
/ 2 页
返回顶部