Java jsoup - 清除除链接外的所有标签

4

输入字符串:

<b>测试链接</b> <a href="https://www.w3schools.com">访问W3Schools</a>

期望结果:

测试链接 <a href="https://www.w3schools.com">访问W3Schools</a>

我使用jsoup尝试过:

public String cleanHtml(String html)
    {
        Whitelist whitelist = Whitelist.none();
        whitelist.addTags("a");

        return Jsoup.clean(html, whitelist);
    }

结果是:

测试链接 <a>访问 W3Schools</a>

如何删除所有标签,但保留整个a href

1个回答

6
您需要使用addAttributes,在此处传递允许的属性列表,例如:whitelist.addAttributes("a","href","id","more")
请尝试以下操作:
String html = "<b>Test link</b> <a href=\"https://www.w3schools.com\">Visit W3Schools</a>";
    Whitelist whitelist = Whitelist.none();
    whitelist.addTags("a");
    whitelist.addAttributes("a","href");

    System.out.println(Jsoup.clean(html, whitelist));

网页内容由stack overflow 提供, 点击上面的
可以查看英文原文,
原文链接