首页 新闻 会员 周边 捐助

c#多线程网络爬虫技术

0
悬赏园豆:10 [待解决问题]

  爬虫原理很简单,但要实现起来却挺复杂的。首先要懂得线程、还要熟悉深度优先和广度优先,最重要的是要根据自己的需要来设置正则表达式提取网上的内容。

  需要一个程序,可以把网页上需要的内容根据自己的设置提取出来。比如:淘宝里有许多商品,我需要把里面的商品全部用爬虫技术爬出来存放在一个EXCAL表里。

   求c#源码。。。。

式圣2012的主页 式圣2012 | 初学一级 | 园豆:196
提问于:2012-02-24 15:18
< >
分享
所有回答(3)
0

自己写去

az235 | 园豆:8483 (大侠五级) | 2012-02-24 16:22

正在写!!

支持(0) 反对(0) 式圣2012 | 园豆:196 (初学一级) | 2012-02-24 16:23
0

你这不就是Etao么,另外现在task封装了线程操作已经很方便了,至于页面分析,将来会越来越繁琐也是一门学问,人家总是会变的。

today4king | 园豆:3499 (老鸟四级) | 2012-02-24 16:34
0

试试神箭手云爬虫平台的淘宝商品信息及评价采集爬虫(按商品搜索关键字)支持云端自动采集,实时监控更新~

爬虫链接:http://www.shenjianshou.cn/index.php?r=market/configDetail&pid=119

采集到的数据可以直接导出EXCEL文件

sosozzzx | 园豆:302 (菜鸟二级) | 2016-08-29 16:32
清除回答草稿
   您需要登录以后才能回答,未注册用户请先注册