我想要获取网页的HTML并保存到一个String
中,以便我可以对其进行一些处理。同时,我该如何处理不同类型的压缩。
使用Java,我该如何实现这个功能?
我想要获取网页的HTML并保存到一个String
中,以便我可以对其进行一些处理。同时,我该如何处理不同类型的压缩。
使用Java,我该如何实现这个功能?
package test;
import java.net.*;
import java.io.*;
public class PDFTest {
public static void main(String[] args) throws Exception {
try {
URL oracle = new URL("http://www.fetagracollege.org");
BufferedReader in = new BufferedReader(new InputStreamReader(oracle.openStream()));
String fileName = "D:\\a_01\\output.txt";
PrintWriter writer = new PrintWriter(fileName, "UTF-8");
OutputStream outputStream = new FileOutputStream(fileName);
String inputLine;
while ((inputLine = in.readLine()) != null) {
System.out.println(inputLine);
writer.println(inputLine);
}
in.close();
} catch(Exception e) {
}
}
}