42得票10回答
将HTML转换(渲染)为带有正确换行符的文本

我需要将 HTML 字符串转换为纯文本(最好使用 HTML Agility 解析器)。同时保留适当的空格和正确的换行。 当我提到 "正确的换行" 时,我的意思是以下代码: And by "proper line-breaks" I mean that this code:<div...

41得票3回答
HtmlAgilityPack选择子节点的结果不符合预期

我试图使用HtmlAgilityPack库解析页面中的一些链接,但是我发现方法的结果与我的期望不符。以下是一个包含链接的HtmlNodeCollection。对于每个链接,我想检查是否有一个图片节点,然后解析它的attributes,但是linkNode的SelectNodes和SelectS...

40得票2回答
HtmlAgilityPack - 如何通过Id获取标签?

我有一个任务要完成。我需要检索特定 id (该 id 基于用户输入)的 tag 或 href。例如,我有一个像这样的 html:<manifest> <item href="Text/Cover.xhtml" id="Cov" media-type="application...

40得票8回答
使用Html Agility Pack从HTML中获取所有文本

输入<html><body><p>foo <a href='http://www.example.com'>bar</a> baz</p></body></html> 输出foo bar baz 我...

35得票2回答
使用HtmlAgilityPack解析HTML页面

我想使用C#获取此示例HTML脚本中的文本框值(即:john):<TD class=texte width="50%"> <DIV align=right>Name :<B> </B></DIV></TD> <TD ...

34得票2回答
HtmlAgilityPack -- <form>标签是否因某种原因自动闭合?

我刚刚写了这个测试来看看我是否疯了...using System; using System.Collections.Generic; using System.Linq; using System.Text; using HtmlAgilityPack; namespace HtmlAgi...

33得票5回答
C# HTML Agility Pack获取类名元素

我想获取所有 class 中包含特定单词的 div: &lt;div class="hello mike"&gt;content1&lt;/div&gt; &lt;div class="hello jeff&gt;content2&lt;/div&gt; &lt;div class="joh...

33得票1回答
Html Agility Pack. 加载和抓取网页

这是在进行网页爬取时最好的方式吗?HttpWebRequest oReq = (HttpWebRequest)WebRequest.Create(url); HttpWebResponse resp = (HttpWebResponse)oReq.GetResponse(); var doc...

32得票3回答
HtmlAgilityPack设置节点InnerText。

我想要用另一段文本替换HTML标签内的文本。我正在使用HtmlAgilityPack我使用以下代码提取所有文本HtmlDocument doc = new HtmlDocument(); doc.Load("some path") foreach (HtmlNode node in doc....

31得票2回答
HtmlAgilityPack 替换节点

我想用一个新的节点替换一个现有节点。如何获取该节点的确切位置并进行完全替换? 我尝试了以下方法,但我无法弄清楚如何获取节点的索引或调用哪个父节点的 ReplaceChild() 方法。string html = "&lt;b&gt;bold_one&lt;/b&gt;&lt;strong&g...