使用HtmlAgilityPack查找所有带有data属性的元素

3
我正在使用Html-agility-Pack解析一个Html文本块。是否可以通过其属性/属性值找到所有元素的列表?
例如,以下是一个示例html文本。使用Html-agility-pack如何找到具有"data-glossaryid"属性的所有元素?
<p> sample text <a href="" data-glossaryid="F776EB48BD"></a>
<p><img  alt="my pic" src="/~/media/Images/mypic.jpg" /></p>
sample text 
<a  href="" data-glossaryid="5D476EB49E"></a>
<p>  more sample text  </p>
<span data-glossaryid="F776EB49EF"> </span>
1个回答

6
// the html block of text to parse
var a = @"<p> sample text <a href="""" data-glossaryid=""F776EB48BD""></a>
<p><img  alt=""my pic"" src=""/~/media/Images/mypic.jpg"" /></p>
sample text <a  href="""" data-glossaryid=""5D476EB49E""></a>
<p>  more sample text  </p>
<span data-glossaryid=""F776EB49EF""> </span>";

// create an HtmlDocument
var htmlDocument = new HtmlDocument();
htmlDocument.LoadHtml(a);

// get all elements with the attr data-glossaryid and prints its values
foreach (var item in htmlDocument.DocumentNode.SelectNodes("//*[@data-glossaryid]"))
    Console.WriteLine(item.GetAttributeValue("data-glossaryid", ""));

有许多HTML解析库,HtmlAgilityPack不错,但当文档过长时会出现问题。从那时起,我更喜欢AngleSharp。 - Alexander Leyva Caro

网页内容由stack overflow 提供, 点击上面的
可以查看英文原文,
原文链接