1、防君子不防小人的做法,声明不欢迎robot,可参看
但目前国内的这些蜘蛛是君子还是小人,这个我就不多说了。
2. 防小人,很贵,好的程序员,破解反破解.... 就看你愿意花多少钱了。一言难尽。
网址如
/list/subject1/gender2/district3
/list/subject1/gender2/district35
其中subject,gender,district是参数名,参数后面的是值。
这些参数排列组合
有无数的url
robots.txt无能为力
只要想爬.你就会被爬.和条件组合没关系.
做调用频率检测吧.
检查参数组合,如果发现参数过多,就要登录