我将使用file.readline()函数在Python中读取一个包含罗马尼亚语单词的文件。由于编码问题,我遇到了许多字符方面的问题。
例如:
>>> a = "aberație" #type 'str'
>>> a -> 'abera\xc8\x9bie'
>>> print sys.stdin.encoding
UTF-8
我尝试使用utf-8、cp500等进行编码,但都不起作用。
我找不到正确的字符编码应该使用哪个?
提前感谢您的帮助。
编辑:目标是将文件中的单词存储在字典中,并在打印时获得“aberație”,而不是“abera\xc8\x9bie”。