我有一个使用UTF8编码的XML文件,并且该文件在开头包含BOM字节。因此,在解析时,我遇到了org.xml.sax.SAXParseException: Content is not allowed in prolog的错误。
但我不能从文件中移除这三个字节。由于文件太大,也不能将其加载到内存中并在此处删除。
为了提高性能,我使用SAX解析器,如果在""标记之前存在这3个字节,则仅跳过它们。 那么我应该继承InputStreamReader来实现吗?
由于我对Java还不熟悉,请指导正确的做法。
但我不能从文件中移除这三个字节。由于文件太大,也不能将其加载到内存中并在此处删除。
为了提高性能,我使用SAX解析器,如果在""标记之前存在这3个字节,则仅跳过它们。 那么我应该继承InputStreamReader来实现吗?
由于我对Java还不熟悉,请指导正确的做法。