芝麻内存三元组存储

Question

芝麻内存三元组存储

3

- Using openrdf-sesame-latest
- Using in-memory repository in Sesame Standalone Server
- Using REST api interface (SPARQL queries) to Sesame Standalone server
- Have few hundred thousands triples for now
- have 16GB of memory on Sesame Server
- Moderate writes and reads

我只是想请教专家们的意见和帮助。

我开始将我的应用程序建立在它之上，作为一个POC。我正在考虑4Stores和Mulgara、Alleograph（免费）等选项。

鉴于我的经验较少，我想知道什么情况下绝对需要从Sesame Server转移出去。
是规模、安全性、写入/读取性能等吗？
如果我只有10万三元组，我是否需要转向其他存储方式，为什么？
我打算将其用于生产用例。

只是我想尽量避免在没有必要的情况下投资时间进行迁移。让我换种方式问“我可以使用openrdf-sesame-latest standalone server与内存存储库（16GB）在生产中使用吗？如果不行，为什么呢？”

- gaurav jain

1个回答

网页内容由stack overflow 提供, 点击上面的

可以查看英文原文，
原文链接

- Jeen Broekstra · Accepted Answer

作为 Sesame 开发人员之一，我显然有偏见，但我不明白为什么你不能使用它。 Sesame 在许多生产环境中得到成功应用。内存存储随着可用 RAM 的数量而扩展，尽管我个人从未测试过超过几百万三元组，但只要不用完堆空间，您可以继续添加而不会出现显著的性能损失。您提到了 100,000 个三元组，这是微不足道的，Sesame 可以轻松处理数量级更大的数据集。

Sesame 的优点还在于，它实际上并不是单一的三元组存储库，而是支持多个存储后端的框架和 API。对于任何少于 1.5 亿个三元组的数据，Sesame 本地存储是一个很好的解决方案（更好的持久性，更小的内存占用量，这可能是即使您的数据适合内存，也要使用此选项的好理由）。

如果您需要超出此限制，还有其他几个选项，包括支持 Sesame API 的第三方三元组存储库，如 OWLIM 或 BigData，因此即使您发现需要更大的三元组存储库，您也不必在代码层面上进行太多更改，只需插入不同的存储库即可。