在Python中无法逐个字符打印中文字符串

3

我的test.txt文件包含以下字符:

地藏菩萨本愿经卷上
忉利天宫神通品第一

我有一个简单的程序:

f = open("test.txt")
text = f.read()
f.close()

print text

for c in text:
    print c,

print "\n------------"

for i in range(len(text)):
    print text[i],

以下是结果:

地藏菩萨本愿经卷上
忉利天宫神通品第一
------------ 
å œ ° è — マ è マ © è ミ ¨ æ œ ¬ æ „ ¿ ç » マ å ヘ · ä ¸ Š 
å ¿  å ˆ © å ¤ © å ® « ç ¥ ž é € š å “ チ ç ¬ ¬ ä ¸ € 


å œ ° è — マ è マ © è ミ ¨ æ œ ¬ æ „ ¿ ç » マ å ヘ · ä ¸ Š 
å ¿  å ˆ © å ¤ © å ® « ç ¥ ž é € š å “ チ ç ¬ ¬ ä ¸ €

如果我使用“打印文本”,“text”将被正确地打印出来。但是尝试逐个字符打印的两种方法都失败了。
发生了什么?

你明白为什么需要解码吗? - Grijesh Chauhan
1个回答

4

您需要先将从文件中读取的数据解码为utf-8:

>>> with open('abc1') as f:
        text = f.read().decode('utf-8')
...     
>>> print text                              
地藏菩萨本愿经卷上 忉利天宫神通品第一
>>> for x in text:
    print x,
...     
地 藏 菩 萨 本 愿 经 卷 上   忉 利 天 宫 神 通 品 第 一

或者使用 io.open 以所需的编码打开文件:

>>> import io
>>> with io.open('abc1', encoding='utf-8') as f:
    text = f.read()
>>> for x in text:                              
    print x,
...     
地 藏 菩 萨 本 愿 经 卷 上   忉 利 天 宫 神 通 品 第 一

网页内容由stack overflow 提供, 点击上面的
可以查看英文原文,
原文链接