我正在开发一个需要存储大量文档(PDF、Word文件等)的系统。我正在使用Solr/Lucene来搜索从这些文档中提取出的相关信息,但我还需要一个地方来存储原始文件,以便用户可以打开/下载它们。
我考虑了几种可能性:
- 文件系统 - 可能不是存储100万个文档的好主意。 - SQL数据库 - 但我不需要大部分关系特性,因为我只需要存储二进制文档及其ID,所以这可能不是最快的解决方案。 - NoSQL数据库 - 我没有任何经验,所以我不确定它们是否好用,而且也有很多种,我不知道该选择哪一种。
我正在寻找的存储方式应该具备以下特点:
- 快速 - 可扩展 - 开源(不是必须的,但很好)
您认为什么是最佳的存储方式?
我考虑了几种可能性:
- 文件系统 - 可能不是存储100万个文档的好主意。 - SQL数据库 - 但我不需要大部分关系特性,因为我只需要存储二进制文档及其ID,所以这可能不是最快的解决方案。 - NoSQL数据库 - 我没有任何经验,所以我不确定它们是否好用,而且也有很多种,我不知道该选择哪一种。
我正在寻找的存储方式应该具备以下特点:
- 快速 - 可扩展 - 开源(不是必须的,但很好)
您认为什么是最佳的存储方式?