代码 大概是这样 ,采集其他网页没有问题
................
client.executeMethod(get);
//
String statusText = get.getStatusText();
//System.out.println("Test.main():--->" + statusText);
System.out.println(
"Test.main():--->"
+
new
String(get.getResponseBodyAsString().getBytes(
"GB2312"
),
"UTF-8"
));
InputStream in = get.getResponseBodyAsStream();
BufferedReader br =
new
BufferedReader(
new
InputStreamReader(in, charset));
String tempbf;
html =
new
StringBuffer(
100
);
........................
java是有福音的, 我记得httpclient开源包中有个EntityUtils, 可以解决你这个问题。
GZIP压缩的
看你豆最少就采纳你把
@assasszt: 好吧, 我之前也碰到过, 不过我是c#做的, 也是碰到gzip压缩过的, 也是郁闷了我一阵
你用Fiddle监视下,看看是不是数据本身就是乱码过来的。
谢谢,其实是网页使用的GZIP压缩,使用GZIPInputSteam接收就可以了
@assasszt: 确实,以前貌似有人也遇到过。