首页 新闻 会员 周边

python 爬取中文如何解码

0
[已解决问题] 解决于 2019-08-04 18:30

用正则表达式爬取中文名字得到\xe9\x9c\xb8\xe7\x8e\x8b\xe5\x88\xab\xe5\xa7\xac,请问如何解码?谢谢!

Charzueus的主页 Charzueus | 菜鸟二级 | 园豆:238
提问于:2019-08-03 13:46
< >
分享
最佳答案
0

用这个工具转出来是霸王别姬
如果是这个结果,代码里用十六进制转字符串相关方法。

奖励园豆:5
ycyzharry | 高人七级 |园豆:25653 | 2019-08-04 15:15

对了,问题解决了,谢谢!

Charzueus | 园豆:238 (菜鸟二级) | 2019-08-04 18:07
其他回答(1)
0

一般直接print("\xe9\x9c\xb8\xe7\x8e\x8b\xe5\x88\xab\xe5\xa7\xac")就行
但你这个显然编码有问题,输出后是霸王别姬
你改一下request编码试试

╄冷丶夜♂ | 园豆:47 (初学一级) | 2019-08-03 16:53

先谢谢了,这个在win cmd用utf-8解码可以显示中文,但是pycharm上不行,还是没找到办法

支持(0) 反对(0) Charzueus | 园豆:238 (菜鸟二级) | 2019-08-03 17:17
清除回答草稿
   您需要登录以后才能回答,未注册用户请先注册