我遇到了一个问题。
文件可以使用一些编码方式进行编写,例如
当我读取一个
文件可以使用一些编码方式进行编写,例如
UTF-8
、UTF-16
、UTF-32
等。当我读取一个
UTF-16
文件时,我使用以下代码: BufferedReader in = new BufferedReader(
new InputStreamReader(
new FileInputStream(file), "UTF16"));
在读取文件之前,我如何确定文件使用哪种编码方式?
当我使用UTF-16
读取UTF-8
编码的文件时,无法正确读取字符。
\x00\x00\x00\x00
是 UTF-8 的四个空字符(U+00000000),还是 UTF-16(大端序)的两个空字符,或者是 UTF-32 的一个空字符? - Kerrek SB