网络爬虫下一页的抓取问题:
<a href="javascript:__doPostBack('rpMessage','pager$5')">6</a>
怎么能够获取下一页
找到这个对应的请求继续发送请求。获取下一页。
javascript:__doPostBack('rpMessage','pager$5')" 请求是靠这个发送的
@蛮荒时代: 你别管它靠什么发送的,你只管发送的是什么。
例如:该方法获取了一堆查询参数然后传入下一页页码最后请求url如下
http://www.example.com/news?id=1&hot=1&xx=xx&xx=xq&page=2
你获取下一页时只要把page=2换成page=3就行了
@蛮荒时代:胡说,post参数并不是直接在url里面,我只是举例
@蛮荒时代: 你给个具体的地址,我帮你找到请求链接。找到请求链接直接发送请求获取源码就行了啊。
@蛮荒时代:
那些就是请求的地址呀。直接请求不就可以了吗?
@蛮荒时代: 什么内部链接
@蛮荒时代: 我这边点下一页都没有反应。
@凝冰: 有,里边信息会更新的。他发送的get请求
找下一页的url
写爬虫的童鞋可以试试神箭手云爬虫,自带JS渲染、代理ip、验证码识别等功能,还可以发布和导出爬取的数据,生成图表等,都在云端进行,不需要安装开发环境。
开发文档参考:http://doc.shenjianshou.cn/
官方开发者QQ群:342953471