16 条回复  ·  1841 次点击
shiguang 小成 2024-12-7 15:32:55
我用的 smartproxy 住宅代理感觉很好啊 (题外话 我最近也在搞爬虫 要搞的网站刚上了 Cloudflare 不知道 op 是否知道绕开 Cloudflare 的方案呢 可付费解决🐶)
defaw 小成 2024-12-7 15:35:01
要么把程序放海外跑,要么就嵌套代理,自己找个机场做第一层,然后你的爬虫代理是第二层
NoOneNoBody 小成 2024-12-7 15:45:54
@shiguang #10 单 ip 5 秒盾没办法,需要多 ip 且每个 ip 用较长的间隔
shiguang 小成 2024-12-7 16:04:21
@NoOneNoBody ip 的话 可以去 smartproxy 用数据中心代理 我看 smartproxy 的也不贵 30 刀起步 50GB 池里的 ip 随便用 昨天朋友给我推了一个 capsolver 我看官网号称可以越过 Cloudflare 照着配置了一下 不太行 老哥有成熟的方案吗🤔
x86 初学 2024-12-7 16:05:03
海外数据海外机爬呀,你不考虑出口延迟的吗
NoOneNoBody 小成 2024-12-7 16:18:28
@shiguang #13 没有,我之前搜了一圈,试过几个别人提供的方案都不行,最后还是拉长了间隔才能过 我不是职业爬虫,只是爬一些个人爱好的数据集,不急,爬到就行(我称为“自动浏览”,😅),也不想搞到人家服务器响应迟缓结果我还爬不到 所以不舍得花钱,也不需要太快,扔后台单线程慢慢跑就是了,上个月爬一个站 11 万 page 非实时信息,断断续续用了 5 天 职业爬虫应该上集群去爬,且用 ip 池,并发,只要客户标识每个不同,不搞死
lysShub 小成 2024-12-7 16:30:24
@Abbeyok 虚拟网卡只是内网的,只要是同一个公网 ip 直接 5s
12
返回顶部