我感到有些愚蠢地问这个问题,答案一定就在我的面前,但是我无法立即在这里或通过更广泛的谷歌搜索找到它。
什么是匹配字母字符(而不是数字)的Python正则表达式? 我正在寻找与[A-Za-z]
等效且支持Unicode的表达式。
\w
的等效项(除非使用 re.ASCII
标志,否则它支持 Unicode),但没有数字。 (我假设没有下划线 - 这也是 \w
的一部分。)\W
并排除数字 \d
:re.findall(r'\b[^\W\d_]+\b', 'Jalape\xf1o Jal99ape\xf1o')
# ['Jalapeño']
如果没有上述的单词边界,它会捕获 ['Jalapeño', 'Jal', 'apeño']
。
\w
但不包括数字和下划线。 "Alpha character"表示当前语言环境或Unicode语言环境定义的任何字母字符。 - iter