吾爱破解 - LCG - LSG |安卓破解|病毒分析|www.52pojie.cn

 找回密码
 注册[Register]

QQ登录

只需一步,快速开始

查看: 7602|回复: 64
上一主题 下一主题
收起左侧

[求助] 爬政府网站太狠了,被封IP怎么办?

[复制链接]
跳转到指定楼层
楼主
hj170520 发表于 2020-11-21 11:37 回帖奖励
昨天爬取政府网站,一时间没控制住他的爬取频率,现在IP 被封了,怎么办呢?

现在挂上了proxy 之后勉强能爬,然后用time.sleep(5)来规避他的反爬机制,但这个方法的弱点是爬取速度太慢了。

请问如何正确的使用proxy来完成快速的爬虫任务呢?


免费评分

参与人数 3吾爱币 +2 热心值 +2 收起 理由
划船不用桨呀 + 1 我很赞同!
lvn036 + 1 + 1 谢谢@Thanks!
yanyyuan + 1 换一个继续

查看全部评分

发帖前要善用论坛搜索功能,那里可能会有你要找的答案或者已经有人发布过相同内容了,请勿重复发帖。

沙发
 楼主| hj170520 发表于 2020-11-21 11:38 |楼主
我可能要爬个36个省市的违规处罚的数据,这数据量可不小呢! 然后还要用re 筛选每一页的姓名、处罚依据、判决、处罚时间。
一个个爬可太气人了呀
头像被屏蔽
3#
枫子树 发表于 2020-11-21 11:39
4#
imyxuan 发表于 2020-11-21 11:40
hj170520 发表于 2020-11-21 11:38
我可能要爬个36个省市的违规处罚的数据,这数据量可不小呢! 然后还要用re 筛选每一页的姓名、处罚依据、判 ...

最好的方式就是不要爬
5#
冥界3大法王 发表于 2020-11-21 11:42
爬多了,会不会进去?
6#
 楼主| hj170520 发表于 2020-11-21 11:42 |楼主
枫子树 发表于 2020-11-21 11:39
构建代{过}{滤}理ip池 用框架不就行了

我搜一搜呀!虽不明,但觉厉啊!
7#
 楼主| hj170520 发表于 2020-11-21 11:45 |楼主
冥界3大法王 发表于 2020-11-21 11:42
爬多了,会不会进去?

不知道啊! 我不算窃取国家机密吧
仅供学习参考
8#
鏃犳瀬112 发表于 2020-11-21 11:47
最好还是频率适当低一些,毕竟这是政府网站
9#
wskk998 发表于 2020-11-21 11:48
扫点IP 来爬  搞几个1W个IP  就算10秒一次也贼快
10#
butchercool 发表于 2020-11-21 11:50
别爬了不就行了
您需要登录后才可以回帖 登录 | 注册[Register]

本版积分规则 警告:本版块禁止回复与主题无关非技术内容,违者重罚!

快速回复 收藏帖子 返回列表 搜索

RSS订阅|小黑屋|处罚记录|联系我们|吾爱破解 - LCG - LSG ( 京ICP备16042023号 | 京公网安备 11010502030087号 )

GMT+8, 2024-5-12 11:01

Powered by Discuz!

Copyright © 2001-2020, Tencent Cloud.

快速回复 返回顶部 返回列表