http://zb.58.com/chuzu/pn1/?PGTID=0d3090a7-0018-1b77-6820-6fbb60fcdd62&ClickID=3
循环访问58同城租房里的所有网页
并且在获取网页源码后访问页面里的链接,获取里面的内容
我是一只很菜很菜的菜鸟
可以用Gumbo啊,我最近就在写爬虫,然后根据源代码进行审查。你可以私聊我我给你链接
或者和C一样把这个网页当作一个文本,然后进行审查
好
@斐雪: 还有什么问题也可以再问我呢
58这种级别的网站应该有防蜘蛛的功能吧。不过你可以试下找个蜘蛛爬下。
我可以爬取页面信息
用HtmlAgilityPack解析html提取你想要的内容。参考地址:http://www.cnblogs.com/asxinyu/p/CSharp_HtmlAgilityPack_XPath_Weather_Data.html