我需要解析大约100kB的HTML数据,在Android上这会导致巨大的性能问题。我尝试过内置的XML解析器和JTidy。
内置的XML解析器给出了约半秒的解析时间,这对我来说是可以接受的。但问题是,使用XML解析器来解析混乱的HTML代码是一个坏主意,所以这不是一个选项。(我尝试过预处理,但它甚至开始抱怨有效的HTML,所以...)
我谷歌了一下,JTidy被建议用于在将其传递给XML解析器之前清理代码。这是一场绝对的噩梦,使用JTidy进行预处理现在需要大约7秒的时间。
所以现在我的唯一替代方案就是正则表达式。你认为呢?
内置的XML解析器给出了约半秒的解析时间,这对我来说是可以接受的。但问题是,使用XML解析器来解析混乱的HTML代码是一个坏主意,所以这不是一个选项。(我尝试过预处理,但它甚至开始抱怨有效的HTML,所以...)
我谷歌了一下,JTidy被建议用于在将其传递给XML解析器之前清理代码。这是一场绝对的噩梦,使用JTidy进行预处理现在需要大约7秒的时间。
所以现在我的唯一替代方案就是正则表达式。你认为呢?