正则表达式:查找不匹配的点(或字符索引)

5
我是正则表达式的初学者。在使用正则表达式验证字符串时,有没有办法找到不匹配的点或字符索引?我已经在Java中使用了RegEx来验证字符串。
我只需要找到第一个不匹配的索引。
更新
请考虑以下示例。
正则表达式:^\d{9}[VX]$
接受的字符串:547812375X
错误的字符串:547A12375X

在错误的字符串中,8被替换为A。我需要找到不匹配的索引,例如这里是4。索引处的字符与正则表达式不匹配。


很抱歉,尽管我们无法确定输入和期望输出,但您不能仅使用普通的正则表达式来完成此操作。 - FailedDev
2
@FailedDev 我在那里添加了一个示例,请帮我解决这个问题。谢谢。 - SachiraChin
由于Java中字符串是从零开始索引的,因此您可能希望将索引3作为响应。对于人类用户,当然希望将其翻译为索引4 - Roland Illig
1个回答

6
我认为这段代码可能就是你想要的:

我觉得这段代码可能做到了你想要的:

package so7783938;

import static org.junit.Assert.assertEquals;

import java.util.regex.Matcher;
import java.util.regex.Pattern;

import org.junit.Test;

public class RegexFailureTest {

  public static int firstFailurePoint(Pattern regex, String str) {
    for (int i = 0; i <= str.length(); i++) {
      Matcher m = regex.matcher(str.substring(0, i));
      if (!m.matches() && !m.hitEnd()) {
        return i - 1;
      }
    }
    if (regex.matcher(str).matches()) {
      return -1;
    } else {
      return str.length();
    }
  }

  @Test
  public void testSimple() {
    Pattern abc = Pattern.compile("abc");
    assertEquals(0, firstFailurePoint(abc, ""));
    assertEquals(1, firstFailurePoint(abc, "a"));
    assertEquals(2, firstFailurePoint(abc, "ab"));
    assertEquals(-1, firstFailurePoint(abc, "abc"));
    assertEquals(3, firstFailurePoint(abc, "abcd"));
    assertEquals(3, firstFailurePoint(abc, "abcdefghi"));
    assertEquals(1, firstFailurePoint(abc, "aaa"));
    assertEquals(2, firstFailurePoint(abc, "abb"));
  }

  @Test
  public void testAlternative() {
    Pattern regex = Pattern.compile("hello|world");
    assertEquals(0, firstFailurePoint(regex, "x"));
    assertEquals(-1, firstFailurePoint(regex, "hello"));
    assertEquals(-1, firstFailurePoint(regex, "world"));
    assertEquals(3, firstFailurePoint(regex, "hel"));
    assertEquals(5, firstFailurePoint(regex, "hello kitty"));
    assertEquals(3, firstFailurePoint(regex, "help me"));
    assertEquals(3, firstFailurePoint(regex, "worse is better"));
  }

  @Test
  public void testExample() {
    Pattern regex = Pattern.compile("^\\d{9}[VX]$");
    assertEquals(-1, firstFailurePoint(regex, "547812375X"));
    assertEquals(3, firstFailurePoint(regex, "547A12375X"));
  }

}

在Java 8或更高版本中(或使用Guava等),如果您喜欢这种面向对象的构造方式,返回一个Optional<Integer>而不是-1作为“魔术值”会更好。 - Maarten Bodewes

网页内容由stack overflow 提供, 点击上面的
可以查看英文原文,
原文链接