我正在使用正则表达式进行HTML标签的剥离(是的,我知道,不要使用正则表达式来解析HTML,但是我只是在剥离它,而且我很不幸不能使用任何外部库)。 我正在使用《正则表达式食谱》中的一个正则表达式,它非常有效,但是我遇到了这个问题:
在字符串 Bob Saget <bobs@aol.com>
中,我的正则表达式将电子邮件地址匹配为标签。
所以我的问题是,@
符号是有效的XML或HTML标签字符吗?(我不是在问它是否在属性中有效;我知道它有效)如果不是,我将能够在我的正则表达式中成功排除它。
我不确定在哪里查找此信息。我在这里查找这里,我认为那里说在XML中,"@"符号不允许在标签中;但是,我希望有些具体的证据。
@
符号是一个有效的字符。但是在标签中它是否有效呢?如果我给HTML或XML解析器一个带有@符号的标签,它会解析吗? - NickAldwinNameChar
规范是一种正式的语法。任何未明确包含在内的内容都被排除在外。您的编辑应该移至答案部分。 - parsifal