首页 新闻 会员 周边 捐助

python怎么判断文本是简体中文

0
[已解决问题] 解决于 2018-08-14 16:36
import re


cn="([\u4e00-\u9fa5]+)"
pattern_cn = re.compile(cn)

s = '謝謝'
s1 = '谢谢'

print(pattern_cn.findall(s1))

怎么判断是简体中文

这个方法不行,

还没有的主页 还没有 | 小虾三级 | 园豆:531
提问于:2018-08-12 16:00
< >
分享
最佳答案
0

这是一个难题,想到一个旁门左道,找一个繁体转简体的库,对源字符串进行繁体转简体操作,如果转换结果与源字符串相同则说明是简体

奖励园豆:5
dudu | 高人七级 |园豆:30778 | 2018-08-12 16:38
其他回答(1)
0

给个思路,不知道这个能不帮到你

>>> '谢谢'.encode("utf-8")
b'\xe8\xb0\xa2\xe8\xb0\xa2'
>>> '謝謝'.encode("utf-8")
b'\xe8\xac\x9d\xe8\xac\x9d'

看得出来繁体跟简体的编码结果是不一样的。

随风行云 | 园豆:936 (小虾三级) | 2018-08-12 16:48
清除回答草稿
   您需要登录以后才能回答,未注册用户请先注册