检查以http://、https://或ftp://开头的正则表达式

61

我正在编写一个正则表达式来检查一个单词是否以 http:// 或者 https:// 或者 ftp:// 开头,我的代码如下:

     public static void main(String[] args) {
    try{
        String test = "http://yahoo.com";
        System.out.println(test.matches("^(http|https|ftp)://"));
    } finally{

    }
}

它打印出false。我还查看了stackoverflow帖子Regex to test if string begins with http:// or https://

这个正则表达式似乎是正确的,但为什么它不匹配呢?我甚至尝试了^(http|https|ftp)\://^(http|https|ftp)\\://


2
为什么要使用正则表达式?为什么不尝试构建URL或URI并从中获取协议? - user207421
6个回答

111
你需要一个完整的输入匹配。
System.out.println(test.matches("^(http|https|ftp)://.*$")); 

编辑:(根据@davidchambers的评论)

System.out.println(test.matches("^(https?|ftp)://.*$")); 

14
如果您喜欢的话,也可以使用 (https?|ftp) - davidchambers
@davidchambers:+1。目标是传达matches方法将匹配整个输入。我会更新您的输入。 - Prince John Wesley
你完成了 .$ 的部分,能否详细说明一下它的含义(我知道它可以获取整行,但用通俗易懂的语言来解释一下 . $ 的意思,谢谢!) - adhg
2
@adhg $ 表示行尾。.* 匹配零个或多个任意字符。 - Prince John Wesley

35

除非有特别的原因需要使用正则表达式,否则我会建议使用String.startsWith方法:

bool matches = test.startsWith("http://")
            || test.startsWith("https://") 
            || test.startsWith("ftp://");

如果这样做更快的话,我不会感到惊讶。


6
如果这不比编译后的正则表达式慢,我会感到惊讶,但必须测试才能得出结论。 - Joel

5
如果您想以不区分大小写的方式执行此操作,则可以使用以下更佳方法:
System.out.println(test.matches("^(?i)(https?|ftp)://.*$")); 

4
我认为正则表达式/字符串解析方案非常好,但在这种特定情况下,似乎使用Java的URL解析器更加合理:

https://docs.oracle.com/javase/tutorial/networking/urls/urlInfo.html

来自该页面:

import java.net.*;
import java.io.*;

public class ParseURL {
    public static void main(String[] args) throws Exception {

        URL aURL = new URL("http://example.com:80/docs/books/tutorial"
                           + "/index.html?name=networking#DOWNLOADING");

        System.out.println("protocol = " + aURL.getProtocol());
        System.out.println("authority = " + aURL.getAuthority());
        System.out.println("host = " + aURL.getHost());
        System.out.println("port = " + aURL.getPort());
        System.out.println("path = " + aURL.getPath());
        System.out.println("query = " + aURL.getQuery());
        System.out.println("filename = " + aURL.getFile());
        System.out.println("ref = " + aURL.getRef());
    }
}

产生以下结果:
protocol = http
authority = example.com:80
host = example.com
port = 80
path = /docs/books/tutorial/index.html
query = name=networking
filename = /docs/books/tutorial/index.html?name=networking
ref = DOWNLOADING

1

test.matches() 方法检查所有文本。使用 test.find()


0

在 startsWith 和 matches 之间添加一个验证。

import java.net.URL


fun main(args: Array<String>) {
    
    val IMAGE_SERVER = "https://google.com/file/"
    val IMAGE_REG: String by lazy {
        val url = URL(IMAGE_SERVER)
        "^(http|https)://${url.host}${url.path}.*\$"
    }
    
    val regx = Regex(IMAGE_REG)
    println(IMAGE_REG)
    

    var begin = System.nanoTime()
    var aa = IMAGE_SERVER.startsWith(IMAGE_SERVER)
    println("startsWith:"+ (System.nanoTime()-begin))
    println("startsWith:"+ aa)
    
    begin = System.nanoTime()
    aa = IMAGE_SERVER.matches(regx)
    println("matches:"+ (System.nanoTime()-begin))
    println("matches:"+ aa)
    

}

startsWith:3755625
startsWith:true
matches:174250
matches:true

在这个场景下,matches的性能和代码清晰度都比startsWith好得多。

matches为174us,startsWith为3.755ms。


网页内容由stack overflow 提供, 点击上面的
可以查看英文原文,
原文链接