采集软件设计成仿浏览器解析,直接读取源码的很容易被屏蔽,js加载的内容页都采集不了!
你好已经使用 WEBKIT实现过得,只采集HTML源码和JS,然后JS做缓存。
可是还是会被屏蔽 因为采集速度过快。谢谢你的回答。
关注。
这个问题,要经历过的人才能给你很好的帮助。没经历过的人,要么纸上谈兵式的根据个人经验和臆测猜想,要么就是自己去做一番实验。
如果是自己做实验的话,说真的,不要说你给的是10分,再多分又有什么价值?能当RMB不?
在这里,应该是:
1、我有热忱助人的精神
2、我刚好路过,看到了。
3、问题刚好我能解决或者我能提供一些参考意见或建议
绝对不会跟分数有关,如果跟分数有关,那些几百分的,还不趋之若鹜?这里的分又不能当饭吃。
@519740105: 谢谢你的回答。
关注。
1.ADSL自动重新拨号
2.自动切换代理
已经搞过了,治标不治本。
@落幕残情: 换了有效的IP,自然不会屏蔽啊。曾经做过国航机票采集,换代理解决
@iImax: 你的目标网站是多少个?目前我们的目标网站 国内外各大搜索引擎,带来IP肯定会被识别出来的呀。。。