Python-3中字符串编码的\x、\u和\U有什么区别？为什么会有这些差异？

Question

20

为什么Python 3中有不同的字节向字符串表示形式？使用单个表示形式而不是多个表示形式是否已经足够了呢？

对于ASCII范围内的数字打印，字符串显示以\x开头的序列：

 In [56]: chr(128)
 Out[56]: '\x80'

在另一种数字范围中，Python使用以\u开头的序列。

In [57]: chr(57344)
Out[57]: '\ue000'

但是在最高范围的数字，即截至目前的最大Unicode数值，它使用前导\U：

In [58]: chr(1114111)
Out[58]: '\U0010ffff'

- MaNKuR

1个回答

网页内容由stack overflow 提供, 点击上面的

可以查看英文原文，
原文链接

- Martijn Pieters · Accepted Answer

Python会为字符串提供一个表示，并对于不可打印的字符使用最短的可用转义序列。例如，\x80与\u0080或\U00000080是相同的字符，但\x80更短。对于chr(57344)，最短的符号是\ue000，你不能使用\xhh表示相同的字符，因为该符号只能用于\0xFF以下的字符。

对于某些字符，甚至有单字母符号，如\n表示换行，\t表示制表符。

由于历史和实际原因，Python具有多种符号选项。在字节串中，您只能创建0-255范围内的字节，所以在无法使用该符号的全范围时，\xhh比到处都要使用\U000hhhhh更简洁且更有帮助，而\xhh和\n等相关符号对于其他语言的程序员来说是熟悉的。