首页新闻招聘找找看知识库

python爬取搜狗微信页面出现验证码怎么办

0
悬赏园豆:50 [已解决问题]

爬取到的data不是想要获取文章页面的源码,而是跳转到验证码的页面的源码。我网上查了一下是由于访问过于频繁导致的,我也加了time.sleep和改了请求头但还是显示不了,求大神支招,除了识别验证码的方式还能怎么做??

村雨sup的主页 村雨sup | 初学一级 | 园豆:102
提问于:2017-08-12 21:27
< >
分享
最佳答案
1

验证码方案几乎是无解的,除非对方的验证码有bug,否则你就放弃吧。我之前写了一个下载器,可以爬到网站上所有资源,我从百度下载爬歌,每次下载不到1000首就出验证码,然后我又写了验证码识别检测模块,人家最后又出了难度更高的验证码,我就直接放弃了。

如果需要登录的资源是没撤的,如果不需要登录,你又用的是独立宽带,遇到验证码可以重新拨号,这样你的外网ip就变了,就又可以正常访问了,但这样效率就下来了,但是能自动化效率肯定比手动高啊。

收获园豆:30
沧海一杰 | 初学一级 |园豆:35 | 2017-08-16 16:44
其他回答(1)
1

不要想着去识别验证码,验证码的产生本身就是为了防止自动化的,如果你破解了微信验证码,你本身就可以做其他更重要的事情了。你说的这种情况我遇到过,即使加时间也没有用的,依然会弹出验证码。我有一个好办法,可以用一些自动化工具从app端获取。

收获园豆:20
ycyzharry | 园豆:6915 (大侠五级) | 2017-08-12 23:38

有哪些自动化工具啊??。。。

支持(0) 反对(0) 村雨sup | 园豆:102 (初学一级) | 2017-08-13 20:51

@村雨sup: appium在安卓上面跑的不错

支持(0) 反对(0) ycyzharry | 园豆:6915 (大侠五级) | 2017-08-13 23:45
   您需要登录以后才能回答,未注册用户请先注册