C#库用于清理HTML

3
我想知道在 .Net 中是否有一个库可以清理和删除 HTML 文档中未闭合的标签?
2个回答

3

很抱歉再次打扰您,我尝试使用Html Agility Pack,但没有成功。我的做法是创建一个新的HtmlDocument对象,并在构造函数中传入包含要修复的HTML字符串,但是我需要将文档作为字符串返回,而我不知道如何实现。 - ryudice
我使用HtmlDocument类解析了我的文本,但它仍然存在未闭合的标签,有没有办法将它们移除? - ryudice
我一时想不起来了,但是尝试使用outputasxml,或者在那里有另一个选项可以修复嵌套标签,但我不确定在什么情况下它会起作用。 - Luke Schafer
卢克,我相信你指的是我刚刚回答自己问题的答案。https://dev59.com/QkvSa4cB1Zd3GeqPga8l - codygman
我以前用过它,但那是一篇很棒的文章,谢谢分享。 - Luke Schafer

2

1
对于C#语言,特定的链接是由Mark Beaton维护的一个名为TidyManaged的项目。链接地址为https://github.com/markbeaton/TidyManaged。 - wonea

网页内容由stack overflow 提供, 点击上面的
可以查看英文原文,
原文链接