如何根据数字和子字符串拆分字符串?
输入:34AG34A
期望输出:{"34","AG","34","A"}
我尝试使用Regex.Split()
函数,但无法确定哪种模式适用。
有什么想法吗?
(\d+|[A-Za-z]+)
将返回您需要的组。我认为您需要寻找两种模式:
因此,我会使用([a-z]+)|([0-9]+)
。
例如,System.Text.RegularExpressions.Regex.Matches("asdf1234be56qq78", "([a-z]+)|([0-9]+)")
返回6组,包含"asdf"、"1234"、"be"、"56"、"qq"、"78"。
首先,您要求“数字”,但没有具体说明您的意思。
如果您指的是“0-9之间的数字”,则需要使用字符类[0-9]
。还有字符类\d
,除了0-9之外,还匹配其他一些字符。
\d匹配任何十进制数字。它等同于\p{Nd}正则表达式模式,其中包括标准的十进制数字0-9以及其他字符集中的十进制数字。
我假设您不对负数、包含小数点、外文数字(如五)等感兴趣。
在这里,Split不是正确的解决方案。您似乎想要对字符串进行分词而不是分割它。您可以使用Matches
而不是Split
来实现此目的:
string[] output = Regex.Matches(s, "[0-9]+|[^0-9]+")
.Cast<Match>()
.Select(match => match.Value)
.ToArray();
var m = Regex.Match("34AG34A", "([0-9]+|[A-Z]+)");
while (m.Success) {
Console.WriteLine(m);
m = m.NextMatch();
}