我有一个输入字符串,如下:
我知道我可以逐个字符地读取,并跟踪前一个字符以确定是否应该对其进行标记化(两个数字连续在一起意味着不要对其进行标记化),但是有没有更符合Python语言特性的方法呢?
a1b2c30d40
,我希望将它分解为:a, 1, b, 2, c, 30, d, 40
。我知道我可以逐个字符地读取,并跟踪前一个字符以确定是否应该对其进行标记化(两个数字连续在一起意味着不要对其进行标记化),但是有没有更符合Python语言特性的方法呢?
\d
代表0-9,+
代表一个或多个)。 - user395760\n
或\t
)时才会有影响(以避免在其中转义\\
)。 - Cat Plus Plusr'(\d+)'
,读者可能会花时间阅读有关转义问题的内容...... - 6502