芝麻内存三元组存储

3
- Using openrdf-sesame-latest
- Using in-memory repository in Sesame Standalone Server
- Using REST api interface (SPARQL queries) to Sesame Standalone server
- Have few hundred thousands triples for now
- have 16GB of memory on Sesame Server
- Moderate writes and reads

我只是想请教专家们的意见和帮助。

我开始将我的应用程序建立在它之上,作为一个POC。我正在考虑4Stores和Mulgara、Alleograph(免费)等选项。

  • 鉴于我的经验较少,我想知道什么情况下绝对需要从Sesame Server转移出去。
  • 是规模、安全性、写入/读取性能等吗?
  • 如果我只有10万三元组,我是否需要转向其他存储方式,为什么?
  • 我打算将其用于生产用例。

只是我想尽量避免在没有必要的情况下投资时间进行迁移。让我换种方式问“我可以使用openrdf-sesame-latest standalone server与内存存储库(16GB)在生产中使用吗?如果不行,为什么呢?”

1个回答

9
作为 Sesame 开发人员之一,我显然有偏见,但我不明白为什么你不能使用它。 Sesame 在许多生产环境中得到成功应用。内存存储随着可用 RAM 的数量而扩展,尽管我个人从未测试过超过几百万三元组,但只要不用完堆空间,您可以继续添加而不会出现显著的性能损失。您提到了 100,000 个三元组,这是微不足道的,Sesame 可以轻松处理数量级更大的数据集。
Sesame 的优点还在于,它实际上并不是单一的三元组存储库,而是支持多个存储后端的框架和 API。对于任何少于 1.5 亿个三元组的数据,Sesame 本地存储是一个很好的解决方案(更好的持久性,更小的内存占用量,这可能是即使您的数据适合内存,也要使用此选项的好理由)。
如果您需要超出此限制,还有其他几个选项,包括支持 Sesame API 的第三方三元组存储库,如 OWLIM 或 BigData,因此即使您发现需要更大的三元组存储库,您也不必在代码层面上进行太多更改,只需插入不同的存储库即可。

网页内容由stack overflow 提供, 点击上面的
可以查看英文原文,
原文链接