我正在尝试处理一个包含HTML的字符串,需要删除一些标签(img、object)和其他所有HTML标签,同时删除它们的属性。例如:
<div id="someId" style="color: #000000">
<p class="someClass">Some Text</p>
<img src="images/someimage.jpg" alt="" />
<a href="somelink.html">Some Link Text</a>
</div>
Would become:
<div>
<p>Some Text</p>
Some Link Text
</div>
我正在尝试:
string.replaceAll("<\/?[img|object](\s\w+(\=\".*\")?)*\>", ""); //REMOVE img/object
我不确定如何删除标签内的所有属性。
如果有帮助,将不胜感激。
谢谢。