首页 新闻 会员 周边 捐助

用的语言是C# .net抓取后台数据,抓取下来的数据出现了乱码,求教这么处理?

0
[已解决问题] 解决于 2014-01-14 16:29

网页后台抓取,自己的后台,准备从构,先把数据拿下来放到新数据库去,现在能同步网络把数据解析拿下来了,但是遇到一个问题,就是比如拿下来的第一个网页的数据【做的抓取程序是winform的】 在winform的dataGridView1控件上显示就是正常的,可抓取第二页的时候解析出来的数据显示时 全是乱码,这是怎么回事?

_尼欧的主页 _尼欧 | 初学一级 | 园豆:158
提问于:2014-01-11 10:44
< >
分享
最佳答案
0

下载的适用指定编码格式,

奖励园豆:5
吴瑞祥 | 高人七级 |园豆:29449 | 2014-01-14 11:58
其他回答(4)
0

抓取的时候先抓取byte 然后按照网页的编码比如utf-8  然后从字节数组中 按照utf8格式转化

可以参考我这边文章http://www.cnblogs.com/wolf-sun/p/3505750.html

我当时抓取的也是乱码

wolfy | 园豆:2636 (老鸟四级) | 2014-01-11 11:22

你做的这个不错,我也比较懒- -!

支持(0) 反对(0) _尼欧 | 园豆:158 (初学一级) | 2014-01-11 13:11
0

网站的显示时的编码受到很多参数的影响,检测网页编码其实网上并没有很完美的方法,这个网站兼容了,那个网站就不行了。我是用WebBrowser控件来下载内容,然后获取DocumentText, 绝无乱码。如果有,就是此网站不兼容IE,那就没办法了。

空明流光 | 园豆:111 (初学一级) | 2014-01-11 21:19
0

编码不对吧

平常心队长 | 园豆:1113 (小虾三级) | 2014-01-13 10:03
0

自己搞定了...

_尼欧 | 园豆:158 (初学一级) | 2014-01-14 16:28
清除回答草稿
   您需要登录以后才能回答,未注册用户请先注册