如何在Python中将Unicode文件读取为Unicode字符串

Question

3

我有一个文件，它使用Unicode或UTF-8编码（我不知道具体是哪个）。当我在Python 3.4中读取该文件时，结果字符串被解释为ASCII字符串。如何将其转换为类似于u"text"的Unicode字符串？

- Melab

1个回答

网页内容由stack overflow 提供, 点击上面的

可以查看英文原文，
原文链接

- Sci Prog · Accepted Answer

术语“Unicode”指的是标准，而不是特定的编码方式。由于计算机文件是二进制的，因此存在将Unicode数据编码为二进制文件的不同方法之一是“UTF-8”。

这篇文章中摘自“读写Unicode数据”部分的一个例子。

with open('unicode.txt', encoding='utf-8') as f:
  for line in f:
    print(repr(line))

在Python 3中，与Python2不同的是，Unicode字符串常量不需要使用“u”进行标记。