查看: 2041|回复: 0

Python 查看文件的编码格式方法

[复制链接]

166

主题

616

帖子

1万

积分

xdtech

Rank: 5Rank: 5

积分
11641
发表于 2019-2-27 23:14:57 | 显示全部楼层 |阅读模式
本帖最后由 Happy清子 于 2019-2-27 23:16 编辑

在读取中文的情况下,通常会遇到一些编码的问题,但是首先需要了解目前的编码方式是什么,然后再用decode或者encode去编码和解码,下面是使用chardet库来查看编码方式的。


import chardet
path = "E:/t.csv"
#path = "E:/t.zip"
f = open(path,'rb')
data = f.read()
print(chardet.detect(data))


打印结果如下:

{'encoding': 'GB2312', 'confidence': 0.99, 'language': 'Chinese'}


回复

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

快速回复 返回顶部 返回列表