作为现在夏天,我决定学习一门新的语言,并选择了Python。实际上,我想学习的是如何使用Python操纵阿拉伯文本。现在,我已经找到了许多关于使用Python的资源,这些资源非常棒。然而,当我将所学应用于阿拉伯字符串时,我得到的是数字和字母混合在一起。
以英文为例:
现在,是阿拉伯语:
我需要修改什么才能使Python始终识别阿拉伯字母?
以英文为例:
>>> ebook = 'The American English Dictionary'
>>> ebook[2]
'e'
现在,是阿拉伯语:
>>> abook = 'القاموس العربي'
>>> abook[2]
'\xde' #the correct output should be 'ق'
然而,使用print
是没有问题的,就像这样:
>>> print abook[2]
ق
我需要修改什么才能使Python始终识别阿拉伯字母?
u"القاموس العربي"
。 - Oleh Prypinق
和'\xd9\x82'
在输出中的区别是print 'ق'
和print repr('ق')
之间的区别。默认情况下(sys.displayhook
),REPL会显示对象的repr
(一个无歧义的表示,旨在满足o == eval(repr(o))
)。print 'ق'
会产生一个更易读的(但可能有歧义的)表示。 - jfs