要爬取网页,如www.39.net网站里的数据,但是该网页却设置了反爬虫,不能把网页爬下来,请问,如何才能把网页爬下来,谢谢,急用。。。。
没发现这个站有反爬虫啊,你遇到了什么问题?
就是不能把这个网站的页面以及和这个网站有相关的链接网站的页面通过代码自动下载下来
@式圣2012: 看起来是正常的,所有的东西也都在网页源代码里,并没有什么限制,你的代码是怎么抓取的?具体遇到什么问题?