Python文件读取、写入时报错

悬赏园豆：20 [待解决问题]

-- coding: utf-8 --

import jieba

with open('./nlp_test0.txt') as f:

document = f.read()

document_decode = document.decode('GBK')

document_cut = jieba.cut(document_decode)

#print  ' '.join(jieba_cut)  //如果打印结果，则分词效果消失，后面的result无法显示

result = ' '.join(document_cut)

result = result.encode('utf-8')

with open('./nlp_test1.txt', 'w') as f2:

    f2.write(result)

f.close()

f2.close()

UnicodeDecodeError Traceback (most recent call last)
<ipython-input-55-40dd9f231eb6> in <module>
4
5 with open('./nlp_test0.txt') as f:
----> 6 document = f.read()
7
8 document_decode = document.decode('GBK')

UnicodeDecodeError: 'gbk' codec can't decode byte 0x80 in position 32: illegal multibyte sequence

Python

wynn学习记录 | 初学一级 | 园豆：182
提问于：2020-03-18 21:29

< >

所有回答(3)

你的文本是gbk的
或者是包含了gbk的字节

墨镜带佬星 | 园豆：2313 (老鸟四级) | 2020-03-19 00:13

可以用decode('gbk', 'ignore')忽略非法字符，或者换个编码试试

yytxdy | 园豆：1685 (小虾三级) | 2020-03-19 09:14

这是一个编码错误，把gbk编码转换成utf8编码

stone9693 | 园豆：221 (菜鸟二级) | 2023-11-24 17:03

清除回答草稿

您需要登录以后才能回答，未注册用户请先注册。

欢迎，请先 登录 或者 注册 。

Python文件读取、写入时报错

-- coding: utf-8 --

欢迎，请先登录或者注册。