用C#解析HTML的最佳方法是什么?

66

我正在寻找一个可以解析具有更多HTML特定功能的HTML文件的库/方法,而不仅仅是通用XML解析库。

15个回答

0

试试这个脚本。

http://www.biterscripting.com/SS_URLs.html

当我使用它与这个URL时,

script SS_URLs.txt URL("https://dev59.com/EHVD5IYBdhLWcg3wL4qM")

它展示了这个串的页面上所有链接。

http://sstatic.net/so/all.css
http://sstatic.net/so/favicon.ico
http://sstatic.net/so/apple-touch-icon.png
.
.
.

你可以修改那个脚本来检查图片、变量或其他内容。


0
根据您的需求,您可能会选择更丰富功能的库。我尝试了大部分/所有建议的解决方案,但最出色的是Html Agility Pack。它是一个非常宽容和灵活的解析器。

0

如果您需要查看JS对页面的影响并且准备好启动浏览器,请使用WatiN。


0

0
你可以使用HTML DTD和通用的XML解析库。

8
很少有真实的HTML页面能够通过XML解析库的解析。 - Frank Krueger

网页内容由stack overflow 提供, 点击上面的
可以查看英文原文,
原文链接