如何在Python 3中转义Unicode

3

我知道字符"Latin Small Letter Sharp S" ß 在Unicode点U+00DF,我也知道如何在Python 3中将其转义为字符串:\u00DF

然而,我知道还有其他大型代码点的Unicode前缀(例如U+260E:Black Telephone)。

我见过使用大写字母U,例如\U00DF,我也见过使用\x

我的问题是什么时候使用它们。例如,许多表情符号只是以U+260x给出。我的想法是使用一个大写的U,并在这些数字之前填入12个0s,但是我该何时使用\x,以及何时知道使用前导零(以及有多少个)。

所有这些都是我猜测的,因为我找不到任何文档。


1
你在哪里查找文档?我在这里找到了所有的内容:https://docs.python.org/3/reference/lexical_analysis.html#literals - Greg Hewgill
啊。我在谷歌上搜索了“Python中的Unicode转义”,并查看了3.3.2参考文献。 - Startec
1个回答

2

在我的第一个例子中,为什么U+00DF被转义为\u00DF,而它只有2个十六进制数字? - Startec
1
@Startec:\u00DF 的意思与 \xDF 相同(与 \U000000DF 相同)。 - Greg Hewgill
作者可能认为这样更易读,也许是因为他们的代码库中有其他\u转义字符,或者作者只是更习惯使用它们。 - Andrew Janke

网页内容由stack overflow 提供, 点击上面的
可以查看英文原文,
原文链接