在C#中如何通过类或ID获取HTML源代码中的元素？

Question

在C#中如何通过类或ID获取HTML源代码中的元素？

c#htmlparsinghtml-agility-pack

6

我正在尝试使用C# Windows窗体应用程序根据类或ID名称从HTML源中获取元素。我使用WebClient将源代码放入字符串中，并将其插入到HtmlDocument中使用HTMLAgilityPack。

然而，我发现HTMLAgilityPack的所有示例都是基于标签解析和查找元素。我需要查找特定ID的HTML链接，并检索标记内的值。这种操作是否可行，最有效的方法是什么？我尝试解析ID时遇到了异常。谢谢！

- Drew

1个回答

网页内容由stack overflow 提供, 点击上面的

可以查看英文原文，
原文链接

- Thymine · Accepted Answer

您可以使用XPath来实现这一点：

HtmlDocument doc = new HtmlDocument();
doc.Load(@"file.htm");

HtmlNode node = doc.DocumentNode.SelectSingleNode("//*[@id=\"my_control_id\"]");
string value = (node == null) ? "Error, id not found" : node.InnerHtml;

以下是对xpath的简要解释:

// 表示在路径中搜索所有地方，如果要匹配多个，请使用 SelectNodes
* 表示匹配任何类型的节点
[] 定义"Predicates"，基本上检查相对于此节点的属性
[@id=\"my_control_id\"] 表示查找具有名为"id"且值为"my_control_id"的属性的节点

更多参考