我该如何在JAVA中获取HTML页面并将其保存到数据库中?是否有更简单的方法?
我该如何在JAVA中获取HTML页面并将其保存到数据库中?是否有更简单的方法?
使用URL类在http上接收文件非常简单:
String rawHtml = IOUtils.toString(new URL("http://yahoo.com").openStream());
IOUtils源自org.apache.commons.io,toString方法将整个输入流读入一个字符串中。
不幸的是,使用java.net.URL时,除了网站地址外,您无法控制任何内容(如cookies、头信息等) :-/
个人而言,我会在任何可以使用此方法的地方使用它,因为HttpClient的API过于复杂(太多LOC)只是为了获取网站的源代码。