655得票7回答
如何使用HTML Agility Pack

我该如何使用 HTML Agility Pack? 我的XHTML文档不完全有效,所以我想使用它。我该如何在我的C#项目中使用它?

87得票2回答
HtmlAgilityPack:获取完整的HTML文档作为字符串。

HtmlAgilityPack是否能够将一个HtmlDocument对象中的整个HTML标记作为字符串返回?

76得票6回答
Html Agility Pack通过类名获取所有元素

我正在尝试使用HTML Agility Pack,但是在找到正确的方法方面遇到了麻烦。 例如:var findclasses = _doc.DocumentNode.Descendants("div").Where(d => d.Attributes.Contains("class")...

68得票5回答
如何获取具有多个CSS类的HTML元素

我知道如何获取同一CSS类别的DIV列表,例如:<div class="class1">1</div> <div class="class1">2</div> 使用xpath //div[@class='class1'] 但如果一个div有多个...

63得票5回答
HTML敏捷包 - 解析表格

我想使用HTML Agility Pack来解析复杂网页中的表格,但是在对象模型中迷失了方向。 我查看了链接示例,但没有找到任何表格数据。我是否可以使用XPath获取表格?加载数据后,我基本上不知道如何获取表格。我以前用Perl做过这个,有点笨重,但可行(HTML::TableParser)...

60得票3回答
HtmlAgilityPack and HtmlDecode

我目前正在使用HtmlAgilityPack和控制台应用程序来抓取网站。由于HTML是编码的(它返回像'这样的编码字符),所以在保存内容到我的数据库之前,我必须进行解码。 有没有一种方法可以在不使用HttpUtility.HtmlDecode的情况下使用HtmlAgilit...

53得票4回答
XPath搜索包含特定文本的id的div

在我的HTML页面上有四十个div,但我只想要其中一个。使用Agility Pack搜索并获取所有具有Id的div时,我使用了以下XPath:"//div[@id]" 但是我该如何搜索ID中包含文本“ test”的div呢,就像这样:<div id="out...

53得票5回答
HtmlAgilityPack和选择节点和子节点

希望有人能够帮助我。 假设我有一个包含多个这样的 div 的 html 文档,就像这个例子: <div class="search_hit"> <span prop="name">Richard Winchester</span> &lt...

51得票5回答
HTML敏捷包 - 如何删除不需要的标签而不会删除内容?

我看到了一些相关的问题,但它们并没有涉及到我所面临的问题。 我想使用HTML Agility Pack从我的HTML中删除不需要的标签,同时保留标签内的内容。 例如,在我的场景中,我想保留"b", "i"和"u"这些标签。 对于像这样的输入: <p>我的段落<div&...

43得票2回答
XPath中的通配符在属性值中的应用

我有以下XPath用于匹配class为span的属性://span[@class='amount'] 我想匹配所有具有"class"属性的元素,但它们也可能带有其他类。我认为可以这样做: ``` $(".amount") ``` 然而,这只会选择那些仅具有"class"属性且值为"amo...