使用httpwebrequest 下载不了特定网页

悬赏园豆：10 [已解决问题] 解决于 2015-01-30 11:54

我使用以下代码：

HttpWebRequest request = (HttpWebRequest)HttpWebRequest.Create("http://www.joyme.com/news/hotpics/201501/2968957.html");
request.UserAgent = "Mozilla/4.0 (compatible; MSIE 5.01; Windows NT 5.0)";

HttpWebResponse response = (HttpWebResponse)request.GetResponse();　　
Stream responseStream = response.GetResponseStream();
StreamReader streamReader = new StreamReader(responseStream, System.Text.Encoding.GetEncoding("utf-8"));
string html = streamReader.ReadToEnd();

最终html 这个值是乱码，如果我换成其他网页就没问题，不知哪位能帮忙看下？谢谢

tonyhangzhou | 初学一级 | 园豆：41
提问于：2015-01-30 00:03

< >

最佳答案

你是来黑马云多么？

抓个包就行了啊。

请求头：

Accept: text/html, application/xhtml+xml, */*
Accept-Language: zh-CN
User-Agent: Mozilla/5.0 (Windows NT 6.1; WOW64; Trident/7.0; rv:11.0) like Gecko
Accept-Encoding: gzip, deflate // 这个设置不设置都不影响响应的内容是否压缩
Host: www.joyme.com
DNT: 1
Connection: Keep-Alive
Pragma: no-cache

响应头：

Server: nginx/1.6.2
Date: Fri, 30 Jan 2015 02:48:30 GMT
Content-Type: text/html;charset=utf-8 // 这里告诉你是 utf-8，我愿意相信服务器讲了真话。
Content-Length: 6339
Connection: keep-alive
Content-Encoding: gzip // 告诉你 Content 使用了 gzip 压缩

因此，你拿到 ResponseStream 后，先用 GZipStream 解压缩，然后在用 utf-8 编码来解析成字符串。

if (response.ContentEncoding.ToUpper() == "GZIP")

{

using (GZipStream gzipStream = new GZipStream(networkStream, CompressionMode.Decompress))

{

StreamReader streamReader = new StreamReader(gzipStream, System.Text.Encoding.GetEncoding("utf-8"));

}
}

收获园豆：10

Launcher | 高人七级 |园豆：45050 | 2015-01-30 10:55

多谢，我在这方面初学，给大家添麻烦了

tonyhangzhou | 园豆：41 (初学一级) | 2015-01-30 11:47

其他回答(3)

164313042 | 园豆：202 (菜鸟二级) | 2015-01-30 00:10

你确定这个网页是UTF-8编码的？

XiaoFaye | 园豆：3087 (老鸟四级) | 2015-01-30 07:36

编码，gzip压缩等都有可能引起这样的结果。

幻天芒 | 园豆：37261 (高人七级) | 2015-01-30 09:14

我看其他的工具倒是可以，比较火车头

支持(0) 反对(0) tonyhangzhou | 园豆：41 (初学一级) | 2015-01-30 09:55

@tonyhangzhou: 那种成熟的工具一般都考虑这些，肯定会做一定的处理。

支持(0) 反对(0) 幻天芒 | 园豆：37261 (高人七级) | 2015-01-30 10:43

清除回答草稿

您需要登录以后才能回答，未注册用户请先注册。

欢迎，请先 登录 或者 注册 。

使用httpwebrequest 下载不了特定网页

欢迎，请先登录或者注册。