首页新闻找找看学习计划

AJAX页面如何解析 不加载CSS IMG 不渲染 只解析JS并且HTML DOM解构和浏览器一样

0
悬赏园豆:50 [已关闭问题] 关闭于 2014-05-13 18:00

AJAX如何解析 不加载CSS  IMG  不渲染 只解析JS并且HTML DOM解构和浏览器一样

 

我是用来做 动态页面采集的 希望性能方面好点

例如使用 高级语言自带的 浏览器插件加载的同学请绕道把....  因为那样不能很好的解决我已经测试过了。

希望大神能帮忙解决下 最好是能提供案例

 

需求:

1.不加载CSS

2.不加载IMG

3.执行JS  见错误自动忽略 主要是加载AJAX代码

4.不做渲染   页面抓取的时候不需要

5.DOM结构要和浏览器一样 

 

备注:百度谷歌都翻遍了 包括谷歌英文站点..........纠结

 

 

 

webkit 效果还可以 但是由于不懂 C++不值当如何禁止CSS这些

联系邮箱tangxg1991@163.com

问题补充:

...... 为什么到关键时刻,关键问题的时候就木有人会了。。。。。。求路过的大神帮忙看看问题,谢谢 

落幕残情的主页 落幕残情 | 初学一级 | 园豆:9
提问于:2014-05-09 09:36
< >
分享
所有回答(3)
0

禁用css倒是简单,你要抓取的页面,把里面的style标签都删掉不就可以了

刘宏玺 | 园豆:14004 (专家六级) | 2014-05-09 09:46

这不是主要的,主要的是我想解析 JS代码   动态页面抓取

支持(0) 反对(0) 落幕残情 | 园豆:9 (初学一级) | 2014-05-09 09:47

@落幕残情: 高级语言自带的浏览器插件,除了这个我也没有思路,我觉得这样是可行的

支持(0) 反对(0) 刘宏玺 | 园豆:14004 (专家六级) | 2014-05-09 09:50

@博客¥: 问题里面我已经说得很清楚了,我是做数据抓取的

支持(0) 反对(0) 落幕残情 | 园豆:9 (初学一级) | 2014-05-09 10:02
0

可以试试 selenium

http://blog.csdn.net/shendl/article/details/3971301

l3oz | 园豆:586 (小虾三级) | 2014-05-09 10:19
0

已经解决,花钱购买的 微型浏览器核心

落幕残情 | 园豆:9 (初学一级) | 2014-05-13 18:00
清除回答草稿
   您需要登录以后才能回答,未注册用户请先注册