我想从文件夹中读取所有文件(使用
有没有办法在不知道它们的编码的情况下读取这些文件?
os.walk
),并将它们转换为一个编码(UTF-8)。问题是这些文件的编码不同。它们可能是UTF-8,带BOM的UTF-8,UTF-16。有没有办法在不知道它们的编码的情况下读取这些文件?
os.walk
),并将它们转换为一个编码(UTF-8)。问题是这些文件的编码不同。它们可能是UTF-8,带BOM的UTF-8,UTF-16。from chardet import detect
with open('your_file.txt', 'rb') as ef:
detect(ef.read())
try:
tryToConvertMyFile(from, to, 'utf-8-sig')
except UnicodeDecodeError:
tryToConvertMyFile(from, to, 'utf-16')