我有一些HTML代码,是通过XSLT转换(XML->HTML)得到的。
我想在结果HTML上运行另一个XSLT转换(HTML->HTML)。
我的问题是,第一个转换可能会返回未关闭的标签,比如 "",这意味着我无法使用DocumentBuilder解析结果HTML,因为它使用SAXparser,当然我的HTML文件并不总是有效的XML。 (我会得到一个异常,指出以下XY标签必须关闭。)
我想有两种解决方案。
要么修复结果HTML,关闭未关闭的标签。
要么使用某种HTML解析器获取有效的org.w3c.dom.Document,并跳过像SAX这样的XML解析器。
我真的很想主要使用我用于第一个转换的相同方法,所以我更喜欢上述解决方案之一。问题是我找不到任何明显的第三方jar包可以帮助我。(虽然我已经搜索了。)所以基本上我想知道我的选择是什么,有没有解决这个问题的办法?
非常感谢您的任何帮助。
我想在结果HTML上运行另一个XSLT转换(HTML->HTML)。
我的问题是,第一个转换可能会返回未关闭的标签,比如 "",这意味着我无法使用DocumentBuilder解析结果HTML,因为它使用SAXparser,当然我的HTML文件并不总是有效的XML。 (我会得到一个异常,指出以下XY标签必须关闭。)
我想有两种解决方案。
要么修复结果HTML,关闭未关闭的标签。
要么使用某种HTML解析器获取有效的org.w3c.dom.Document,并跳过像SAX这样的XML解析器。
我真的很想主要使用我用于第一个转换的相同方法,所以我更喜欢上述解决方案之一。问题是我找不到任何明显的第三方jar包可以帮助我。(虽然我已经搜索了。)所以基本上我想知道我的选择是什么,有没有解决这个问题的办法?
非常感谢您的任何帮助。