采集到的html代码不完整,是bug吗?还是说我的采集规则不正确呢?并且采集出来的中文是乱码。这是什么问题呢?
不完整有可能是写的正则不准确。
乱码应该是请求的编码与原网站不符合。
你是说你采集到的原始html不完整还是经过你自己处理之后的html不完整?
超时了,没接收到完整的Stream,因为Stream是可以边读边下载的.