如何使用jsoup来整理HTML

8

我正在使用jsoup,它非常方便整理一些HTML,但是我有一个无效的HTML片段如下:

<p>The recurrence, in close succession <ul><li>list item 1</li><li>list item 2</li></ul> second part of thisssss

What I want to get is :

<p>The recurrence, in close succession </p><ul><li>list item 1</li><li>list item 2</li></ul> <p>second part of thisssss</p>

所以,jsoup能够整理HTML并返回输出吗?
谢谢。
1个回答

10

是的,请尝试这个:

String html = "<p>The recurrence, in close succession <ul><li>list item 1</li><li>list item 2</li></ul> second part of thisssss";
String clean = Jsoup.clean(html, Whitelist.relaxed());

您也可以使用另一个白名单


1
请注意,JSoup确实清理HTML。它解决了像<p><ol></ol></p>这样的问题,并且可以设置为解决例如<br>的问题。 - Andrew

网页内容由stack overflow 提供, 点击上面的
可以查看英文原文,
原文链接