Python 查看文件的编码格式方法

Happy清子 · 发表于 2019-2-27 23:14:57

本帖最后由 Happy清子于 2019-2-27 23:16 编辑

在读取中文的情况下，通常会遇到一些编码的问题，但是首先需要了解目前的编码方式是什么，然后再用decode或者encode去编码和解码，下面是使用chardet库来查看编码方式的。

import chardet
path = "E:/t.csv"
#path = "E:/t.zip"
f = open(path,'rb')
data = f.read()
print(chardet.detect(data))

打印结果如下：

{'encoding': 'GB2312', 'confidence': 0.99, 'language': 'Chinese'}