爬取到的data不是想要获取文章页面的源码,而是跳转到验证码的页面的源码。我网上查了一下是由于访问过于频繁导致的,我也加了time.sleep和改了请求头但还是显示不了,求大神支招,除了识别验证码的方式还能怎么做??
验证码方案几乎是无解的,除非对方的验证码有bug,否则你就放弃吧。我之前写了一个下载器,可以爬到网站上所有资源,我从百度下载爬歌,每次下载不到1000首就出验证码,然后我又写了验证码识别检测模块,人家最后又出了难度更高的验证码,我就直接放弃了。
如果需要登录的资源是没撤的,如果不需要登录,你又用的是独立宽带,遇到验证码可以重新拨号,这样你的外网ip就变了,就又可以正常访问了,但这样效率就下来了,但是能自动化效率肯定比手动高啊。
不要想着去识别验证码,验证码的产生本身就是为了防止自动化的,如果你破解了微信验证码,你本身就可以做其他更重要的事情了。你说的这种情况我遇到过,即使加时间也没有用的,依然会弹出验证码。我有一个好办法,可以用一些自动化工具从app端获取。
有哪些自动化工具啊??。。。
@村雨sup: appium在安卓上面跑的不错