下一页如何用LinkExtractor提取?
网页元素为:
<a href="javascript:;" data-page="2">2</a>
......
<a href="javascript:;" data-page="33">33</a>
<a href="javascript:;" class="next">下一页</a>
感觉JavaScript代码为空啊。。。应该也用不了process_value方法。。
是不是只能利用url规律构造列表,直接调用parse函数?
你需要做网页分析,,打开相关浏览器的开发工具,,选择Network栏目,可以查看客户端和浏览器的来往链接,,
之前看过下面的书:从零开始学Python网络爬虫,里面讲的挺清楚的。
http://item.jd.com/12215717.html