我有一个文件,它使用Unicode或UTF-8编码(我不知道具体是哪个)。当我在Python 3.4中读取该文件时,结果字符串被解释为ASCII字符串。如何将其转换为类似于u"text"的Unicode字符串?
术语“Unicode”指的是标准,而不是特定的编码方式。由于计算机文件是二进制的,因此存在将Unicode数据编码为二进制文件的不同方法之一是“UTF-8”。您可以查阅https://docs.python.org/3/howto/unicode.html。这篇文章中摘自“读写Unicode数据”部分的一个例子。with open('unicode.txt', encoding='utf-8') as f: for line in f: print(repr(line)) 在Python 3中,与Python2不同的是,Unicode字符串常量不需要使用“u”进行标记。