python怎么判断文本是简体中文

[已解决问题] 解决于 2018-08-14 16:36

import re


cn="([\u4e00-\u9fa5]+)"
pattern_cn = re.compile(cn)

s = '謝謝'
s1 = '谢谢'

print(pattern_cn.findall(s1))

怎么判断是简体中文

这个方法不行，

python

还没有 | 小虾三级 | 园豆：533
提问于：2018-08-12 16:00

< >

最佳答案

这是一个难题，想到一个旁门左道，找一个繁体转简体的库，对源字符串进行繁体转简体操作，如果转换结果与源字符串相同则说明是简体

奖励园豆：5

dudu | 高人七级 |园豆：23628 | 2018-08-12 16:38

其他回答(1)

给个思路，不知道这个能不帮到你

>>> '谢谢'.encode("utf-8")
b'\xe8\xb0\xa2\xe8\xb0\xa2'
>>> '謝謝'.encode("utf-8")
b'\xe8\xac\x9d\xe8\xac\x9d'

看得出来繁体跟简体的编码结果是不一样的。

随风行云 | 园豆：965 (小虾三级) | 2018-08-12 16:48

清除回答草稿

您需要登录以后才能回答，未注册用户请先注册。