有人知道JSoup的替代方法吗?
还是如何清除类似于<p> </p>
这样的序列?
jQuery的HTML Clean插件对我很有效,但我想在服务器端而不是在客户端进行html代码清理。
或者说,怎么用replaceAll表达式实现?:
String cleanS = dirtyS.replaceAll("<p> </p>", ""); //This doesnt work
我发现脏的html代码中包含混合使用的空格序列#160,以及其他的例如#32。因此,我需要一个表达式来删除任何混合的空格序列。