最近 在做网络爬虫,然后要登录到别人系统,别人的系统有验证码,每次点击获取验证码,但
是没找到规律,各位同行,帮忙找找规律
好像跟时间 有关系 但是又没观察出来!急死了
/cn/42681.5905958102.VerifyCode2.jpg
42681.5927989583
42681.5928895949
42681.5929585648
42681.5930372917
42681.5933238310
42681.6333480903
42681.6334932523
42681.6338561690
42681.6339820139
42681.6340759028
42681.6341503009
42681.6342860764
42681.6343889931
42681.6344855903
42681.6351151852
42681.6352199074
42681.6360764699
42681.6362026736
42681.6362649653
42681.6363487500
42681.6364184375
42681.6365139583
42681.6366401620
42681.6367513889
就算有规律又如何?这样只是为了避免文件重名而已,验证码的图片还是代码生成的。
验证码生成的还是 服务器生成的 只是请求的时候 就不需要解析html代码了 楼下理解得当
这个很难只能看出随时间递增,我建议你还是老老实实的解析html,利用正则将验证码匹配出来,然后再做操作。
解析HTML是可以的 目前也是这样的 但是要增加一次请求 速度就降低了
@Jack Su Sparrow:将Cookie缓存下来,你又不是每次都需要登录。如果需要一直验证码的话,你可以做个任务队列,多线程做好了。