我正在使用某些方法清除一些不需要的HTML标签(例如<script>
)
String clean = Jsoup.clean(someInput, Whitelist.basicWithImages());
问题在于它将例如å
替换为å
(这对我造成麻烦,因为它不是“纯 XML”)。
例如:
Jsoup.clean("hello å <script></script> world", Whitelist.basicWithImages())
产生的结果。"hello å world"
但是我想要
"hello å world"
有没有一种简单的方法来实现这个?(即比在结果中将å
转换回å
更简单的方法。)