我希望使用面向文档的数据库存储大量JSON文档,这些文档具有非常相似的模式(虽然不完全相同)。
一个示例文档:
编辑:经过深思熟虑,我认为我所询问的是一种更普遍的压缩系统的特定情况,在这种情况下,一个压缩字典在文档存储中被(部分?)共享,并可能随着时间的推移而建立。这将处理不仅仅是JSON键的压缩。
很有趣!
一个示例文档:
{
"firstName": "John",
"lastName": "Smith",
"age": 25,
}
这些系统(如CouchDB等)是否使用任何形式的压缩来避免反复存储键字符串(例如“firstName”)?
我的动机是在有数百万个文档,特别是当一些重复的键比如“firstName”要长得多时,尽量减少磁盘上数据库的大小。
谢谢您的想法!
W
编辑:经过深思熟虑,我认为我所询问的是一种更普遍的压缩系统的特定情况,在这种情况下,一个压缩字典在文档存储中被(部分?)共享,并可能随着时间的推移而建立。这将处理不仅仅是JSON键的压缩。
很有趣!