首页 新闻 搜索 专区 学院

C#爬取html页面中的内容

0
悬赏园豆:20 [已解决问题] 解决于 2022-07-05 09:05

二级目录
By.XPath("//[@id="bodyMain"]/div/div[2]/div/div/span"),
By.XPath("//
[@id="bodyMain"]/div/div[2]/div/div/span")的意思

还有怎么爬取html页面中的分页中的数据,获取到了第一页,但没获取到第二页

宋人鱼的主页 宋人鱼 | 初学一级 | 园豆:14
提问于:2022-07-04 11:01
< >
分享
最佳答案
0

By.XPath("//[@id="bodyMain"]/div/div[2]/div/div/span")这个是指XPath的路径,

//获取尾页的数据,获取其中的数字
var urls = System.Text.RegularExpressions.Regex.Replace(driver.FindElement(By.XPath("/html/body/div[2]/div[3]/div/div[2]/div/div/a[4]")).GetAttribute("href"), @"[^0-9]+", "");

然后循环添加

宋人鱼 | 初学一级 |园豆:14 | 2022-07-05 09:04
清除回答草稿
   您需要登录以后才能回答,未注册用户请先注册