我目前正在构建一个正则表达式,可以接受URL和主机名。
因此,以下内容应该被接受:
google
google.com
www.google.com
http://google.com
http://www.google.com
然而,不应该接受的是:
<xml> <html>
我目前得到的表达式是:
([a-zA-Z0-9])|((http(s)?://)?([\w-]+\.)+[\w-]+(/[\w- ;,./?%&=]*)?)
但是表达式的这部分:([a-zA-Z0-9])
匹配<xml>
和<html>
有人有什么建议吗?我错过了什么吗?
parse_url
函数。在Perl中,使用URI
模块。在Ruby中,使用URI
模块。在.NET中,请使用'Uri'类(http://msdn.microsoft.com/en-us/library/txt7706a.aspx)。 - Andy Lester