我需要匹配除以下URL外的所有有效URL:
http://www.w3.org
http://w3.org/foo
http://www.tempuri.org/foo
通常情况下,匹配除某些特定域名外的所有URL。
这是我目前为止的代码:
https?://([-\w\.]+)+(:\d+)?(/([\w/_\.]*(\?\S+)?)?)?
将匹配足够接近我的需求的URL(但不是所有有效的URL!)(感谢http://snipplr.com/view/2371/regex-regular-expression-to-match-a-url/!)
https?://www\.(?!tempuri|w3)\S*
这个正则表达式将匹配所有带有www.
的URL,但不包括tempuri
或w3
域名。
我真的很想要
https?://([-\w\.]+)(?!tempuri|w3)\S*
需要工作,但据我所知,它似乎选择了所有的 http://
字符串。
天啊,我应该在更高的 Chomsky 层次上完成这个!