7得票1回答
使用HTML Agility Pack替换单个节点为多个节点

我有一些占位符的输入标签,需要用一些HTML替换它们。很多时候,我要替换的HTML只有一个标签,这很容易实现: HtmlNode node = HtmlNode.CreateNode(sReplacementString); inputNode.ParentNode.ReplaceChild...

8得票2回答
Html Agility Pack、Web Scraping和C#中的欺骗

有没有一种方法可以在C#代码中伪造Web请求,使其看起来不像机器人或垃圾邮件攻击网站?我正在尝试对我的网站进行网络爬取,但是在一定数量的调用后始终被阻止。我想要像真正的浏览器一样操作。我正在使用HTML Agility Pack中的以下代码。 var web = new HtmlWeb()...

20得票1回答
HTML Agility Pack HtmlDocument显示所有Html?

我正在使用以下代码来获取一个网页,它能够正常工作。 public static HtmlDocument GetWebPageFromUrl(string url) { var hw = new HtmlWeb(); return hw.Load(...

40得票8回答
使用Html Agility Pack从HTML中获取所有文本

输入<html><body><p>foo <a href='http://www.example.com'>bar</a> baz</p></body></html> 输出foo bar baz 我...

8得票2回答
HTMLAgilityPack 选择在注释之间的节点

我正在更换与特定小部件相关的一些头脚本。我希望能够找到位于注释之间的所有与该小部件相关的节点。此外,我想轻松删除与指定小部件相关的任何代码(包括起始和结束注释)。 插入和删除的代码将如下所示: <!-- WidgetScript_WidgetName --> <sc...

11得票3回答
使用XPath和HtmlAgilityPack获取属性值

我有一个HTML文档,我使用XPath进行解析。我想要获取input元素的值,但是没有成功。 我的HTML代码如下:<tbody> <tr> <td> <input type="text" name="item" value=...

7得票2回答
Html Agility Pack能用来解析HTML片段吗?

我需要从ASP.NET页面、用户控件和母版页中获取LINK和META元素,抓取它们的内容,然后在我正在工作的一个实用程序中写回更新后的值。 我可以尝试使用正则表达式来仅抓取这些元素,但是这种方法存在以下几个问题: 我预计许多输入文件将包含损坏的HTML(缺失/顺序不正确的元素等) SCR...

16得票3回答
HTMLAgilityPack和动态内容问题

我想创建一个网络爬虫应用程序,希望使用webbrowser控件、htmlagilitypack和xpath技术。 目前我已经成功地创建了xpath生成器(我使用webbrowser来完成),它的工作很好,但有时我无法抓取动态(通过javascript或ajax)生成的内容。此外,我发现当web...

12得票1回答
HtmlAgilityPack - 获取文档中的所有节点

我想使用HtmlAgilityPack遍历文档中的所有节点。foreach (HtmlNode node in myhtml.DocumentNode.SelectNodes("//@")) 做什么?

30得票2回答
Html Agility Pack - 选择子节点时出现问题

我想将我的 Asics 跑步计划导出到 iCal,但由于 Asics 不提供此服务,所以我决定为自己构建一个小型爬虫。我的目标是从计划中获取所有安排好的跑步并基于此生成一个 iCal 订阅源。我正在使用 C# 和 Html Agility Pack。 我想要做的是遍历我所有预定的跑步(它们都...