首页 新闻 会员 周边 捐助

用c#怎么获取网页中链接里的内容。如何循环访问网页

0
悬赏园豆:100 [已解决问题] 解决于 2016-10-24 15:26

http://zb.58.com/chuzu/pn1/?PGTID=0d3090a7-0018-1b77-6820-6fbb60fcdd62&ClickID=3

循环访问58同城租房里的所有网页

并且在获取网页源码后访问页面里的链接,获取里面的内容

问题补充:

我是一只很菜很菜的菜鸟

斐雪的主页 斐雪 | 初学一级 | 园豆:112
提问于:2016-10-24 09:44
< >
分享
最佳答案
0

可以用Gumbo啊,我最近就在写爬虫,然后根据源代码进行审查。你可以私聊我我给你链接

收获园豆:100
Boblim | 菜鸟二级 |园豆:492 | 2016-10-24 10:05

或者和C一样把这个网页当作一个文本,然后进行审查

Boblim | 园豆:492 (菜鸟二级) | 2016-10-24 10:06

斐雪 | 园豆:112 (初学一级) | 2016-10-24 10:07

@斐雪: 还有什么问题也可以再问我呢

Boblim | 园豆:492 (菜鸟二级) | 2016-10-24 10:15
其他回答(2)
0

58这种级别的网站应该有防蜘蛛的功能吧。不过你可以试下找个蜘蛛爬下。

Daniel Cai | 园豆:10424 (专家六级) | 2016-10-24 09:58

我可以爬取页面信息

支持(0) 反对(0) 斐雪 | 园豆:112 (初学一级) | 2016-10-24 10:01
0

用HtmlAgilityPack解析html提取你想要的内容。参考地址:http://www.cnblogs.com/asxinyu/p/CSharp_HtmlAgilityPack_XPath_Weather_Data.html

雨之秋水 | 园豆:649 (小虾三级) | 2016-10-24 10:22
清除回答草稿
   您需要登录以后才能回答,未注册用户请先注册