8得票1回答
HTML敏捷包获取所有类为div的元素

我正在尝试爬取一个复杂的HTML页面。我需要获取某些特定类别的div中的文本内容。 我的目标是使用HTML Agility Pack遍历整个HTML页面,找出所有类包含“listevent”的div,并将其返回给我。 当我在网上搜索时,发现如果进行映射,这是可能的,但其中一些div位于许多...

19得票3回答
HtmlAgilityPack 登录后提交表单

我正在尝试使用HtmlAgilityPack登录一个网站(网站:http://html-agility-pack.net)。现在,我无法确定如何去做。我已经尝试通过设置Html表单值来进行操作。m_HtmlDoc.DocumentNode.SelectSingleNode("//input[@...

7得票1回答
C#中是否有一个对象可以轻松管理HTML DOM?

如果我有一个字符串,其中包含我刚从HTTP Post返回的页面的HTML,我如何将其转换为可以让我轻松遍历DOM的内容? 我想HtmlDocument对象会有意义,但它没有构造函数。是否有任何类型可允许轻松管理HTML DOM? 谢谢, 马特

10得票1回答
如何使用HTML Agility Pack获取标题标签

我正在使用HTML Agility Pack解析HTML文件。我想获取以下内容: <title>Some title <title> 如您所见,标题没有类。 因此,无论我尝试什么,我都无法捕获它。 我在互联网上也找不到解决方案。 我该如何捕获这个没有类的HTML标...

13得票1回答
HTMLagilitypack不能删除所有的HTML标签,我该如何高效地解决这个问题?

我正在使用以下方法从字符串中删除所有HTML:public static string StripHtmlTags(string html) { if (String.IsNullOrEmpty(html)) return ""; ...

20得票1回答
Html Agility Pack在迭代中始终返回相同的结果,如何解决?

我想获取集合中的节点,但使用SelectSingleNode迭代时,我始终得到相同的对象,只是node.Id在变化... 我的尝试是读取给定站点的webresponse,并捕获特定定义元素中的一些信息,例如值、链接等。 int offSet = 0; string address = "ht...

16得票3回答
在C#中解析HTML表格

我有一个包含表格的HTML页面,我想在C# Windows窗体中解析该表格。 http://www.mufap.com.pk/payout-report.php?tab=01 这是我想要解析的网页,我已经尝试过了。> Foreach(Htmlnode a in documen...

15得票2回答
HTML Agility Pack - 如何在Head元素顶部添加元素?

我想使用HTML Agility Pack将一个脚本元素添加到我的HTML头部的顶部。到目前为止,我看到的示例只是使用AppendChild(element)方法来实现这一点。我需要将我要附加到头部的脚本放在其他某些脚本之前。我该如何指定它的位置呢? 以下是我的尝试:HtmlDocument...

34得票2回答
HtmlAgilityPack -- <form>标签是否因某种原因自动闭合?

我刚刚写了这个测试来看看我是否疯了...using System; using System.Collections.Generic; using System.Linq; using System.Text; using HtmlAgilityPack; namespace HtmlAgi...

7得票2回答
使用C#模拟无限滚动以获取完整页面的HTML。

有很多网站使用这种(在我看来)令人烦恼的“无限滚动”样式。例如,像tumblr、twitter、9gag等网站。 最近,我尝试使用HtmlAgilityPack程序自动抓取这些网站的图片,就像这样: HtmlWeb web = new HtmlWeb(); HtmlDocument d...