用c#怎么获取网页中链接里的内容。如何循环访问网页

悬赏园豆：100 [已解决问题] 解决于 2016-10-24 15:26

http://zb.58.com/chuzu/pn1/?PGTID=0d3090a7-0018-1b77-6820-6fbb60fcdd62&ClickID=3

循环访问58同城租房里的所有网页

并且在获取网页源码后访问页面里的链接，获取里面的内容

c#爬取页面

问题补充：

我是一只很菜很菜的菜鸟

斐雪 | 初学一级 | 园豆：112
提问于：2016-10-24 09:44

< >

最佳答案

可以用Gumbo啊，我最近就在写爬虫，然后根据源代码进行审查。你可以私聊我我给你链接

收获园豆：100

Boblim | 菜鸟二级 |园豆：492 | 2016-10-24 10:05

或者和C一样把这个网页当作一个文本，然后进行审查

Boblim | 园豆：492 (菜鸟二级) | 2016-10-24 10:06

好

斐雪 | 园豆：112 (初学一级) | 2016-10-24 10:07

@斐雪: 还有什么问题也可以再问我呢

Boblim | 园豆：492 (菜鸟二级) | 2016-10-24 10:15

其他回答(2)

58这种级别的网站应该有防蜘蛛的功能吧。不过你可以试下找个蜘蛛爬下。

Daniel Cai | 园豆：10424 (专家六级) | 2016-10-24 09:58

我可以爬取页面信息

支持(0) 反对(0) 斐雪 | 园豆：112 (初学一级) | 2016-10-24 10:01

用HtmlAgilityPack解析html提取你想要的内容。参考地址：http://www.cnblogs.com/asxinyu/p/CSharp_HtmlAgilityPack_XPath_Weather_Data.html

雨之秋水 | 园豆：649 (小虾三级) | 2016-10-24 10:22

清除回答草稿

您需要登录以后才能回答，未注册用户请先注册。