<html>
<body>
<div class="main">
<div class="submain"><h2></h2><p></p><ul></ul>
</div>
<div class="submain"><h2></h2><p></p><ul></ul>
</div>
</div>
</body>
</html>
我将HTML加载到了一个HtmlDocument
对象中。然后我选择了XPath为submain
。但我不知道如何分别访问每个标签,例如h2
,p
。HtmlAgilityPack.HtmlNodeCollection nodes = doc.DocumentNode.SelectNodes("//div[@class=\"submain\"]");
foreach (HtmlAgilityPack.HtmlNode node in nodes) {}
如果我使用node.InnerText
,我会得到所有的文本,而InnerHtml
也没有用。如何选择单独的标签?
node.SelectSingleNode("./h2")
。 - Cyclion