多线程,线程池。
再不行msmq用上。再不行,在数据存储方面在弄弄
你得说明 采集花了多少时间 ,存储花了多少时间,看你时间耗在哪呀。
用treadpool应该没有什么问题。
数据存储,使用事务,批量数据插入。
10万条记录4个小时?太慢了吧。
我这边做的,2个小时采集加数据过滤。可以取200万以上的东西。
你的性能太差了。
我这边的方法是,用多细程先采集并过滤到本地,然后统一发布到服务器。
上面的同志们的网速太牛逼了.而且目标网站也太弱了.我采集国外的无限级分类,2个小时才能采7千多.不能多开线程,因为对方限制了,而且网速也慢.