HTML解析器验证标签

4
我需要一个HTML解析器,它能够识别生成的HTML中的错误,并在标签未关闭时关闭它并返回有效的HTML。
更多细节:我从数据库获取数据并将其分解以显示部分详细信息在我的网站上,点击更多按钮后显示完整内容。在分解字符串后进行验证。
我已经使用了Html Agility Pack,但是我是第一次使用它,如果这个库可以解决我的问题,请指导我如何使用(教程)或建议我另一个库。
2个回答

2
我认为这样的图书馆并不存在。问题在于,有些图书馆确实可以识别您HTML中的错误,但它们无法为您修复它们。
我认为使用W3C验证器作为服务是最好的起点。有一个开源库使用W3C验证器的API来验证文档,并给出响应,如果它是有效的或者有错误和警告。我会从这里开始,然后再继续深入。

1

请再次阅读问题,我已添加更多细节以便更好地理解。 - Xulfee
尝试使用HTML::Tidy,它有在线和本地部署选项。如果我需要清理标签,我会简单地通过Perl和HTML::Tidy运行我的标记来快速清理标记。在Yahoo、Bing或Google上搜索它。抱歉,我不是Google的狂热者,我喜欢多元化! - DoctorLouie

网页内容由stack overflow 提供, 点击上面的
可以查看英文原文,
原文链接