有没有人知道一些好用的Java库(或单独的方法),可以从HTML文件中去除额外的空格、换行符和制表符等,使得HTML文件基本上被转换成了一行。
谢谢。
更新: 看起来没有现成的库能做到这点,所以我创建了我的开源项目来解决这个任务:http://code.google.com/p/htmlcompressor/
有没有人知道一些好用的Java库(或单独的方法),可以从HTML文件中去除额外的空格、换行符和制表符等,使得HTML文件基本上被转换成了一行。
谢谢。
更新: 看起来没有现成的库能做到这点,所以我创建了我的开源项目来解决这个任务:http://code.google.com/p/htmlcompressor/
看起来没有现成的库可以实现这个功能,所以我创建了自己的开源项目来解决这个任务,也许会有人觉得有帮助:http://code.google.com/p/htmlcompressor/
个人而言,我只在服务器上启用了HTTP压缩,并且保留了我的可读HTML。
但是,对于您想要的内容,您可以使用String.replaceAll()函数,并使用与您指定的正则表达式匹配的方式。从我的经验来看,可以这样写:
small=large.replaceAll("\\s{2,}"," ");
请小心处理。pre和textarea元素内的文本将会被破坏。此外,script元素内的嵌入式javascript必须以分号结尾。最后,如果您使用HTML注释来编写嵌入式javascript(以避免一些旧浏览器的错误行为),这将最终注释掉整个嵌入式javascript代码。
你为什么要这样做?如果您想减少HTML的下载大小,那么您只需要一个GZIP过滤器即可。
input.replaceAll("\s+", " ");
将任何空格转换为单个空格