我有一个HTML字符串,我正在使用HtmlAgilityPack解析HTML字符串。
这是我的html字符串:
<p class="Normal-P" style="direction: ltr; unicode-bidi: normal;"><span class="Normal-H">sample<br/></span> <span class="Normal-H">texting<br></span></p>
这个HTML字符串中有两个
<br>
标签,我该如何删除它们?我有一个HTML字符串,我正在使用HtmlAgilityPack解析HTML字符串。
这是我的html字符串:
<p class="Normal-P" style="direction: ltr; unicode-bidi: normal;"><span class="Normal-H">sample<br/></span> <span class="Normal-H">texting<br></span></p>
<br>
标签,我该如何删除它们?操作步骤如下:
HtmlDocument
中"//br"
xpath表达式获取所有<br />
标签Remove()
方法删除前面一步中获得的标签DocumentNode.OuterHtml
属性中以下是代码示例:
const string htmlFragment =
@"<p class=""Normal-P"" style=""direction: ltr; unicode-bidi: normal;"">" +
@"<span class=""Normal-H"">sample<br/></span>" +
@"<span class=""Normal-H"">texting<br></span></p> ";
var document = new HtmlAgilityPack.HtmlDocument();
document.LoadHtml(htmlFragment);
foreach (var brTag in document.DocumentNode.SelectNodes("//br"))
brTag.Remove();
Console.WriteLine(document.DocumentNode.OuterHtml);
string html = ...;
string html = Regex.Replace(html, "<br>", "", RegexOptions.Singleline);
<br/>
标签。而且使用正则表达式解析 HTML 通常是一个坏主意:https://dev59.com/X3I-5IYBdhLWcg3wq6do#1732454 - Cristian Lupascu