我有一些格式不规范的HTML代码,有时候会缺少双引号。此外,有时候会出现大写字母,而其他时候则是小写字母:
<DIV class="main">
<DIV class="subsection1">
<H2>
<DIV class=subwithoutquote>StackOverflow</DIV></H2></DIV></DIV>
我希望能够匹配多行且忽略大小写。但是以下模式似乎无法工作。(对于连接,我也尝试了 | 而不是 &)
const string pattern = @"<div class=""?main""?><div class=""?subsection1""?><h2><div class=""?subwithoutquote""?>(.+?)</div>";
Match m = Regex.Match(html, pattern, RegexOptions.IgnoreCase & RegexOptions.Singleline);
或者我应该在模式中添加\n*来解决多行问题吗?
\s+
。 - nhahtdh