10得票4回答
HTMLAgilityPack无法正确关闭图像标签

使用HTMLAgilityPack写出一个新的图像节点时,它似乎会删除图像的闭合标签,例如应该是,但是当您检查outer html时,它变成了。 string strIMG = "<img src='" + imgPath + "' height='" + pubImg.Height ...

11得票7回答
使用Html Agility Pack选择属性值

我正在尝试使用HTML Agility Pack和以下XPath从HTML文档中检索特定图像://div[@id='topslot']/a/img/@src 据我所见,它找到了src属性,但返回的是img标签。这是为什么? 我原本期望InnerHtml/InnerText或类似的内容会被设置...

8得票2回答
使用htmlagilitypack无法从https URL下载HTML数据

我有一个与htmlagilitypack(HAP)相关的“小”问题。当我试图从网站获取数据时,出现以下错误: 未处理的类型为'System.ArgumentException'的异常在mscorlib.dll中发生 附加信息:'gzip'不是受支持的编码名称。有关定义自定义编码的信息,请参阅...

17得票4回答
HTML Agility Pack移除换行标签闭合。

我正在使用 HTML Agility Pack 创建一个 HTML 文档。我加载一个模板文件,然后将内容附加到它上面。这些都有效,但是当我查看输出文件时,它已经删除了我的 <br/> 标签的闭合标签,变成了这样的 <br>。是什么原因导致这种情况发生?Dim doc A...

8得票5回答
失去了HtmlAgilityPack中loadhtml函数的“小于”符号

我最近开始尝试使用HtmlAgilityPack。我不熟悉它的所有选项,因此我认为我做错了什么。 我有一个包含以下内容的字符串: string s = "<span style=\"color: #0000FF;\"><</span>"; 你看到在我的sp...

7得票1回答
如何使用HTML Agility Pack选择嵌套元素?

I have a following kind of xml/html <root> <p1> <l1> <a>something</a> <a>something</a&g...

10得票1回答
HtmlAgilityPack和身份验证

如果我有一个特定的网址,我可以获取该页面的id和xpath。但是如何在请求中传递用户名和密码以便我可以抓取需要登录才能访问的url?using HtmlAgilityPack; _web = new HtmlWeb(); internal Dictionary<string, str...

7得票1回答
C#中是否有一个对象可以轻松管理HTML DOM?

如果我有一个字符串,其中包含我刚从HTTP Post返回的页面的HTML,我如何将其转换为可以让我轻松遍历DOM的内容? 我想HtmlDocument对象会有意义,但它没有构造函数。是否有任何类型可允许轻松管理HTML DOM? 谢谢, 马特

7得票2回答
Html Agility Pack能用来解析HTML片段吗?

我需要从ASP.NET页面、用户控件和母版页中获取LINK和META元素,抓取它们的内容,然后在我正在工作的一个实用程序中写回更新后的值。 我可以尝试使用正则表达式来仅抓取这些元素,但是这种方法存在以下几个问题: 我预计许多输入文件将包含损坏的HTML(缺失/顺序不正确的元素等) SCR...

12得票1回答
HTML Agility Pack创建新的HTMLNode

我正在使用HTML Agility Pack来解析和转换一个HTML文件,但是当我尝试创建一个新的HTMLNode时,由于索引参数,我得到了一个异常“该项已经被添加”。HtmlNode node1 = new HtmlNode(HtmlNodeType.Element, doc, 0); n...