首页 新闻 搜索 专区 学院

python转码utf8,但读时还是 'gbk' codec can't decode byte 0x80 in position 8: illegal multibyte sequence

0
[已解决问题] 解决于 2018-08-17 16:33
 
 
复制代码
{'encoding': 'utf-8', 'confidence': 0.99, 'language': ''}

Traceback (most recent call last):
  File "H:/PyCharmProject/ass/temp1.py", line 55, in <module>
    date=f.readline()
UnicodeDecodeError: 'gbk' codec can't decode byte 0x80 in position 8: illegal multibyte sequence
复制代码

想试试python转码。

网上随便下了一个txt小说。

python转码失败后,尝试用notepad++转utf8。却可以。

但转完的用 open()打开,还是出错,

不明白为什么 了?

 

 

f=open(r'C:\Users\ty\Downloads\zhenhuan.txt')
while 1:
    date=f.readline()
    if date:
        date=date.strip()
        print(date)
    else:
        break
还没有的主页 还没有 | 小虾三级 | 园豆:527
提问于:2018-08-16 16:13
< >
分享
最佳答案
0
fp = open(myfile,'rb') #二进制打开
keyfile = fp.read().decode('utf-8')#转码
keyfile = keyfile.replace("\n", "--").split("--")#以行剪切,是一个数组

有时候文件里边有一些字符了,什吗鬼的,经常会报一些错,题主可以试试。以上的打开文件的方法,

具体可以参考网址:https://blog.csdn.net/zhangyunfei_happy/article/details/47169939

奖励园豆:5
自说自话唉 | 初学一级 |园豆:193 | 2018-08-17 14:21

谢谢,还是遇到了点小问题,

不过自己解决了。

还没有 | 园豆:527 (小虾三级) | 2018-08-17 16:33
清除回答草稿
   您需要登录以后才能回答,未注册用户请先注册