代码 大概是这样 ,采集其他网页没有问题
................
client.executeMethod(get); // String statusText = get.getStatusText(); //System.out.println("Test.main():--->" + statusText); System.out.println("Test.main():--->" + new String(get.getResponseBodyAsString().getBytes("GB2312"), "UTF-8")); InputStream in = get.getResponseBodyAsStream(); BufferedReader br = new BufferedReader(new InputStreamReader(in, charset)); String tempbf; html = new StringBuffer(100); ........................java是有福音的, 我记得httpclient开源包中有个EntityUtils, 可以解决你这个问题。
GZIP压缩的
看你豆最少就采纳你把
@assasszt: 好吧, 我之前也碰到过, 不过我是c#做的, 也是碰到gzip压缩过的, 也是郁闷了我一阵
你用Fiddle监视下,看看是不是数据本身就是乱码过来的。
谢谢,其实是网页使用的GZIP压缩,使用GZIPInputSteam接收就可以了
@assasszt: 确实,以前貌似有人也遇到过。