如何在Python中将Unicode文件读取为Unicode字符串

3
我有一个文件,它使用Unicode或UTF-8编码(我不知道具体是哪个)。当我在Python 3.4中读取该文件时,结果字符串被解释为ASCII字符串。如何将其转换为类似于u"text"的Unicode字符串?
1个回答

8
术语“Unicode”指的是标准,而不是特定的编码方式。由于计算机文件是二进制的,因此存在将Unicode数据编码为二进制文件的不同方法之一是“UTF-8”。
您可以查阅https://docs.python.org/3/howto/unicode.html
这篇文章中摘自“读写Unicode数据”部分的一个例子。
with open('unicode.txt', encoding='utf-8') as f:
  for line in f:
    print(repr(line))

在Python 3中,与Python2不同的是,Unicode字符串常量不需要使用“u”进行标记。

网页内容由stack overflow 提供, 点击上面的
可以查看英文原文,
原文链接