2019-09-21 读取中文乱码

读取一个txt文档的时候，里面有中文就会导致中文出现乱码，

1. 查看文档格式

with open(path,'r')as f:

text = f.read().encode()

print(chardet.detect(text))

结果：{'encoding': 'utf-8', 'confidence': 0.87625, 'language': ''}显示是utf-8编码

2.此时直接输出text

i:\xe7\xbb\x94\xe6\xac\x93\xe6\x9a\xb1

from: AUTO

可以看到，i后面的中文变成了二进制编码格式，需要如下:

with open(path,'r')as f:

text = f.read()

# print(chardet.detect(text))

text = text.encode('gbk')

text = text.decode('utf-8')

print(text)

大概就是先将他通过gbk转换一下格式，然后在转换为utf-8，这样就可以识别了。

【变量】python中的字符集和编码
字符集和编码简介在编程中常常可以见到各种字符集和编码，包括ASCII,MBCS,Unicode等字符集。确切的说...
兰山小亭阅读 8,633评论 0赞 13
Python2的中文编码问题
python编码错误和中文的乱码问题，研究了整整两天，查阅了很多资料，也走了一些弯路，我把经验写下，让新手少走点弯...
adminlzzs阅读 3,487评论 0赞 4
还在为Python中文乱码烦恼，老司机给你讲讲
转自微信公众号：菜鸟学Python 有没有遇到过这样的问题，读取文件被提示“UnicodeDecodeError”...
阿喆_399a阅读 2,693评论 0赞 5
跟着廖雪峰老师学python （6）
若想技术精进，当然得把基础知识打得牢牢的。廖雪峰的官方网站 python3教程，该网站提供的教程浅显易懂，还附带...
布口袋_天晴了阅读 654评论 0赞 0
Python 四五事
引言在这里我假设你已经看完了一篇Python教程，基本熟悉了Python的结构和语法，在命令行下的Python互...
Programmer客栈阅读 65,142评论 0赞 17

赞1赞

赞赏

手机看全文