使用正则表达式比较两个字符串

6

我正在使用两个字符串来进行匹配程序,像这样:

string s1= 5-4-6-+1-+1+1+3000+12+21-+1-+1-+1-+2-3-4-5-+1-+10+1-+1-+;
string s2= 6-+1-+1+1+3000+12+21-+1-+1-+1-+1-+1-+1+1-+1-+;

我将编写一个正则表达式匹配函数,该函数将分别比较每个“+”之间的部分字符串,并计算匹配百分比,即每个字符串中出现的匹配次数。 例如,在此示例中,我们有以下匹配项:

6

1

1

1

3000

12

21

1

1

1

--

1

--

1

1

在这个例子中,匹配百分比为13 * 100/15 = 87%。
目前我正在使用下面的函数,但我认为它没有进行优化,而使用正则表达式可能会更快。
public double MatchPercent(string s1, string s2) {
    int percent=0;
    User = s1.Split('+').ToArray();
    Policy = s2.Split('+').ToArray();

    for (int i = 0; i < s1.Length - 2; i++) {
        int[] U = User[i].Split('-').Where(a => a != "").Select(n => 
                      Convert.ToInt32(n)).Distinct().ToArray();
        int[] P = Policy[i].Split('-').Where(a => a != "").Select(n => 
                      Convert.ToInt32(n)).Distinct().ToArray();
        var Co = U.Intersect(P);
        if (Co.Count() > 0) {
            percent += 1;
        }
    }
    return Math.Round((percent) * 100 / s1.Length );
}

1
我不明白你想做什么。在你的 for 循环中,你没有使用迭代器值。因此,你应该始终会得到匹配度为 98% 或 0% 的结果。 - Kirill Bestemyanov
6
我认为正则表达式不会起作用。具体来说,我认为你不能通过这种方式在正则表达式中维护状态(即相同计数)。而在匹配后计算这个需要一个可变数量的捕获组。 - jpaugh
你觉得写一个数学计算器或者类似的东西会不会更好呢? - The Mask
9
这本质上是一个对齐问题。在这里,你需要一个合适的序列对齐算法,而不是正则表达式。 - Konrad Rudolph
3
Konrad是正确的;改用正则表达式解决方案不会使你的工作更简单,相反会让它变得更加困难,甚至可能无法实现。 - Alan Moore
显示剩余7条评论
1个回答

2

网页内容由stack overflow 提供, 点击上面的
可以查看英文原文,
原文链接