本人爬虫小白,初学webmagic,问题如下:
1.a标签中的onclick属性值如何获取,如下所示:
代码:
我想获得这个”咨询”与“AH20011700001”这两个值,我现在只获得了这样的:
2.用javascript写的页面如何获取下一页:
如图:
这个如何进入下一页?存入待处理的缓存区?
url给个
@masuo:
from requests_html import HTMLSession
session = HTMLSession()
url = 'http://www.beijing.gov.cn/hudong/hdjl/com.web.search.mailList.flow'
res =session.get(url=url)
data = res.html.xpath('//*[@id="mailul"]/div/div/a/@onclick')
for info in data:
print(info.replace('letterdetail','')[2:4],info.replace('letterdetail','')[7:-2])
@小小咸鱼YwY: 这个是用啥写的。。
@masuo: python,翻页PageCond/begin: 12这个参数控制
@masuo: 先去学前后端基础吧
@小小咸鱼YwY: 那跳入下一个页面呢?