将HTML转换为格式良好的XML

3

我正在寻找一种/库来将HTML输入转换为Java中的格式良好的XML。目前我正在使用jTidy,但问题是jTidy进行了许多我不想要的清理。例如,有时jTidy会删除空格或标记。

那么,有没有一种方法可以在没有“智能”清理的情况下获得格式良好的XML?

2个回答

0

尝试使用NekoHTML。这个库有很多设置,在你的情况下可能会很有用。


0

网页内容由stack overflow 提供, 点击上面的
可以查看英文原文,
原文链接