如题,我使用xmlhttprequest爬取一个网页的内容,结果得到的网页中,中文是乱码。
请问该怎么办?
使用合适的解码器进行解码。
比如我去请求的那个网页的编码是gb2312,我发起请求的时候没能设置编码,结果取得的html被自动解码成了utf-8或gbk什么的。
这种情况下,中文已经是乱码了,我想要知道的是怎么在nodejs里面再正确的转成中文
@第二个星期一: 1.按到里是有buffer的,直接buffer编码至指定字符集;
2.如果已经被编码至某字符集,那么反解码是不是就可以得到原始buffer?——后面自己接上