我有一个论坛,允许用户输入大量文本以及(经过消毒的)HTML(和/或Markdown)和链接等。在存储到数据库之前,所有内容都经过消毒和检查。使用gzcompress是否是个好主意?我听说如果要搜索这些文本,它不太好用。我应该在保存到数据库之前压缩内容,并仅使用标题和标签进行搜索,还是无所谓?
我会将内容存储为文本。如果空间成为问题,您可以稍后探索此优化。您可能会发现这个讨论值得一读: Planning for efficiency early vs Premature optimization
gzcompress
有什么优势(如果有的话)?理论上的“因为它可以缩小数据”不算数,除非可以用一个好的用例来证明——例如,数据库空间真的很紧张吗(并且数据压缩是否将使用量减少到功能要求内)?减少的IO是否必需满足功能要求(假设它确实提高了性能)?像这样的更多小“优化”,使得数据/模型更难处理。 - user166390