求思路求思路求思路求思路求思路求思路求思路求思路
python实现简单爬虫功能或者直接用scrapy,专业的爬虫框架。帮你解决各种问题,只用自己稍微代码设置i 就既可以调用
熬得。我研究研究scrapy。
1获取整个网站页面数据->2用正则表达式提取URL并放入数组->3循环每个URL并进行第一步。
http://www.jb51.net/article/40529.htm
jb51是我最不喜欢的网站之一, 全是广告!
使用python爬虫工具pyspider
self.crawl(url, callback=self.index_page)