首页 新闻 搜索 专区 学院

webmagic的两个问题,

0
悬赏园豆:50 [已解决问题] 解决于 2020-01-18 11:40

本人爬虫小白,初学webmagic,问题如下:
1.a标签中的onclick属性值如何获取,如下所示:
代码:

我想获得这个”咨询”与“AH20011700001”这两个值,我现在只获得了这样的:

2.用javascript写的页面如何获取下一页:
如图:
这个如何进入下一页?存入待处理的缓存区?

masuo的主页 masuo | 初学一级 | 园豆:159
提问于:2020-01-17 17:22
< >
分享
最佳答案
0

url给个

收获园豆:50
小小咸鱼YwY | 老鸟四级 |园豆:2918 | 2020-01-17 17:40

@masuo:

from  requests_html import HTMLSession
session = HTMLSession()

url = 'http://www.beijing.gov.cn/hudong/hdjl/com.web.search.mailList.flow'
res =session.get(url=url)
data = res.html.xpath('//*[@id="mailul"]/div/div/a/@onclick')
for info in data:
    print(info.replace('letterdetail','')[2:4],info.replace('letterdetail','')[7:-2])
小小咸鱼YwY | 园豆:2918 (老鸟四级) | 2020-01-17 18:30

@小小咸鱼YwY: 这个是用啥写的。。

masuo | 园豆:159 (初学一级) | 2020-01-17 18:36

@masuo: python,翻页PageCond/begin: 12这个参数控制

小小咸鱼YwY | 园豆:2918 (老鸟四级) | 2020-01-17 18:37

@masuo: 先去学前后端基础吧

小小咸鱼YwY | 园豆:2918 (老鸟四级) | 2020-01-17 18:49

@小小咸鱼YwY: 那跳入下一个页面呢?

masuo | 园豆:159 (初学一级) | 2020-01-17 18:55
清除回答草稿
   您需要登录以后才能回答,未注册用户请先注册