我想知道是否有人能介绍一种算法,将Unicode文本压缩至其原始大小的10-20%?我已经阅读了Lempel-Ziv压缩算法,可以将文本大小减小到原始大小的60%,但我听说还有一些具备这种性能的算法。
PAQ 是文本压缩的新冠军...有几种不同的版本,您可以在这里找到相关信息。
我推荐三种版本:
您需要从源代码自己构建它们,幸运的是有人制作了一个GUI FrontPAQ,将两个最好的二进制文件打包成一个。
一旦您拥有了一个功能强大的二进制文件,使用起来很简单,文档可以在这里找到。
注意:我知道这是一个非常古老的问题,但我希望包含相关的现代数据。我寻找同样的问题,但找到了一个更新更强大的答案。