首页 新闻 搜索 专区 学院

采集到的html代码不完整,是bug吗?

0
悬赏园豆:20 [已解决问题] 解决于 2010-07-28 14:39

采集到的html代码不完整,是bug吗?

还是说我的采集规则不正确呢?

并且采集出来的中文是乱码。

这是什么问题呢?

问题补充: 但我采集的代码不完整这个怎么解释呢? 补充2: 怎么样实现简单的表单提交及cookie保存? 补充3: 为什么我去除html标签以后,css样式全部都在,麻烦贴个代码谢谢!
Elisabeth的主页 Elisabeth | 初学一级 | 园豆:180
提问于:2010-07-27 15:03
< >
分享
最佳答案
0

不完整有可能是写的正则不准确。

乱码应该是请求的编码与原网站不符合。

收获园豆:20
Astar | 高人七级 |园豆:40805 | 2010-07-27 15:08
你的“问题补充”是什么意思?
Astar | 园豆:40805 (高人七级) | 2010-07-27 15:23
@Astar:因为我采集纯html是没有使用经过正则的,现在已经采集到完整的html了。
Elisabeth | 园豆:180 (初学一级) | 2010-07-27 15:33
@Elisabeth:你意思是采集一个URL的所有源码吧?然后问题是获取的不完整?表单提交可以模拟POST或GET,保存Cookie用CookieContainer。
Astar | 园豆:40805 (高人七级) | 2010-07-27 15:39
@Astar:对的!
Elisabeth | 园豆:180 (初学一级) | 2010-07-27 17:59
@Elisabeth:是不是超时了,你可以单步调试一下。
Astar | 园豆:40805 (高人七级) | 2010-07-27 18:00
其他回答(2)
0

你是说你采集到的原始html不完整还是经过你自己处理之后的html不完整?

Ou lei | 园豆:619 (小虾三级) | 2010-07-27 15:21
0

超时了,没接收到完整的Stream,因为Stream是可以边读边下载的.

Launcher | 园豆:45045 (高人七级) | 2010-07-27 17:47
清除回答草稿
   您需要登录以后才能回答,未注册用户请先注册