我有数百万个基于 GUID(http://en.wikipedia.org/wiki/Globally_Unique_Identifier)生成的音频文件。如何将这些文件存储到文件系统中,以便可以在同一文件系统中高效添加更多文件,并且可以高效地搜索特定文件。同时,它还应该具有可扩展性。
文件根据GUID命名(唯一文件名)。
例如:
[1] 63f4c070-0ab2-102d-adcb-0015f22e2e5c
[2] ba7cd610-f268-102c-b5ac-0013d4a7a2d6
[3] d03cf036-0ab2-102d-adcb-0015f22e2e5c
[4] d3655a36-0ab3-102d-adcb-0015f22e2e5c
请提供您的意见。
注:我已经阅读了 Storing a large number of images。我需要特定的数据结构/算法/逻辑,使其在未来也可扩展。
编辑1:文件数量约为100-200万,文件系统为ext3(CentOS)。
谢谢。
文件根据GUID命名(唯一文件名)。
例如:
[1] 63f4c070-0ab2-102d-adcb-0015f22e2e5c
[2] ba7cd610-f268-102c-b5ac-0013d4a7a2d6
[3] d03cf036-0ab2-102d-adcb-0015f22e2e5c
[4] d3655a36-0ab3-102d-adcb-0015f22e2e5c
请提供您的意见。
注:我已经阅读了 Storing a large number of images。我需要特定的数据结构/算法/逻辑,使其在未来也可扩展。
编辑1:文件数量约为100-200万,文件系统为ext3(CentOS)。
谢谢。
纳文
63/63f4/63f4c070-...
中),那么对于200万个文件,每个叶子目录大约会有30个文件 - 这应该表现得相当不错,并且可以适度扩展。 - caf