我正在编写Java代码...
有人知道如何将javax.swing.text.html.HTMLDocument的内容作为字符串获取吗?这是我目前为止的成果...
我需要HTMLDocument的内容作为字符串。
例如:
有人知道如何将javax.swing.text.html.HTMLDocument的内容作为字符串获取吗?这是我目前为止的成果...
URL url = new URL( "http://www.test.com" );
HTMLEditorKit kit = new HTMLEditorKit();
HTMLDocument doc = (HTMLDocument) kit.createDefaultDocument();
doc.putProperty("IgnoreCharsetDirective", Boolean.TRUE);
Reader HTMLReader = new InputStreamReader(url.openConnection().getInputStream());
kit.read(HTMLReader, doc, 0);
我需要HTMLDocument的内容作为字符串。
例如:
<!DOCTYPE HTML PUBLIC "-//W3C//DTD HTML 4.01//EN" "http://www.w3.org/TR/html4/strict.dtd"> <html><head><meta http-equiv="X-UA-Compatible" content="IE=Edge,chrome=1">
......等等。
任何帮助都将不胜感激。我需要使用HTMLDocument类以便正确地处理HTML :)
谢谢Daniel