下载的适用指定编码格式,
抓取的时候先抓取byte 然后按照网页的编码比如utf-8 然后从字节数组中 按照utf8格式转化
可以参考我这边文章http://www.cnblogs.com/wolf-sun/p/3505750.html
我当时抓取的也是乱码
你做的这个不错,我也比较懒- -!
网站的显示时的编码受到很多参数的影响,检测网页编码其实网上并没有很完美的方法,这个网站兼容了,那个网站就不行了。我是用WebBrowser控件来下载内容,然后获取DocumentText, 绝无乱码。如果有,就是此网站不兼容IE,那就没办法了。
编码不对吧
自己搞定了...