我使用 HtmlAgilityPack 来解析某些 HTML 页面,我从页面中提取 HTML 标签,如下所示:
HtmlNode bodyContent = document.DocumentNode.SelectSingleNode("//body");
var all_text = bodyContent.SelectNodes("//div | //ul | //p | //table");
在返回的HTML中,每个标签都包含类和ID。我想删除所有ID和所有类,我该如何做到这一点?
我使用 HtmlAgilityPack 来解析某些 HTML 页面,我从页面中提取 HTML 标签,如下所示:
HtmlNode bodyContent = document.DocumentNode.SelectSingleNode("//body");
var all_text = bodyContent.SelectNodes("//div | //ul | //p | //table");
HtmlNode bodyContent = document.DocumentNode.SelectSingleNode("//body");
var all_text = bodyContent.SelectNodes("//div | //ul | //p | //table");
foreach(var node in all_text)
{
node.Attributes.Remove("class");
node.Attributes.Remove("id");
}