Tinkerpop蓝图顶点查询

Question

Tinkerpop蓝图顶点查询

3

我已经研究了Tinkerpop技术栈很长一段时间。我认为我对它的功能以及它适用的数据库有很好的了解。我目前考虑了几个不同的数据库，但还没有决定使用哪一个。因此，我决定纯粹地按接口编写代码，暂时不考虑任何具体实现。在我所看的数据库中，它们都实现了TransactionalGraph和KeyIndexableGraph。我认为这已经足够满足我的需求了，但我有一个问题。

我有不同的顶点类。使用Blueprints，我认为最好的方式是在每个顶点中添加一个包含类名的字段来表示。这样，我就可以像graph.getVertices("classname", "User")这样做，并获取所有用户顶点。由于getVertices函数指定一个实现应该利用索引，所以我可以保证快速查找（如果我对该字段进行索引）。

但是，假设我想基于两个属性检索一个顶点。该顶点必须具有className=Users和username=admin。最好的方法是什么？是否可能对这两个属性都建立索引，即使并非所有顶点都有username字段呢？

FYI- 我目前正在考虑的数据库是OrientDB、Neo4j和Titan，但我还没有最终决定。我目前也计划使用Gremlin，如果这有所帮助。

- GJK

2个回答

3

graph.getVertices()将遍历所有顶点，并查找具有该属性的顶点，如果您的图实现未启用自动索引。如果您已经拥有数据，无法仅打开自动索引器，则应使用index = indexableGraph.getIndex()，然后index.get('classname', 'User')
可以在多个对象上执行query，但没有具体细节很难说。对于Neo4j，它们使用Lucene，这意味着query()将采用Lucene查询，例如className:Users AND username:admin，但我不能代表其他人发表意见。

是的，这些数据库都适合玩耍，我个人发现neo4j最容易使用，只要您理解他们的许可结构，就不应该有任何使用问题。

- Nicholas

好的，正如你所说，这些查询有点特定于实现（不幸的是）。我想随时切换数据库，所以我自己编写了查询包装器。感谢你的帮助。 - GJK

是的，这很不幸，但大多数系统都是这样构建的，有些系统可能没有执行某些类型查询的能力，因此它们留给实现特定的部分。 - Nicholas

说 graph.getVertices() 做了线性扫描并不完全正确。如果图实现了 KeyIndexableGraph（三个提到的图都是），并且指定的键是作为索引创建的键，则使用该索引可以避免进行线性扫描。https://github.com/tinkerpop/blueprints/wiki/Graph-Indices#keyindexablegraph-and-fast-lookup-of-elements-by-keyvalue-pairs - stephen mallette

抱歉，我忘了自动索引器。我以为他在说如果没有启用它。我已更新我的答案，谢谢。 - Nicholas

网页内容由stack overflow 提供, 点击上面的

可以查看英文原文，
原文链接

- stephen mallette · Accepted Answer

使用“类”或“类型”对顶点进行分段是一种很好的方法。例如：

graph.createKeyIndex("classname",Vertex.class);
graph.getVertices("classname", "User");

这是一种相当常见的模式，通常应该可以快速查找，不过如果你打算将特定的classname增长到非常大的规模，那么迭代数千万用户的索引可能并不好。我认为这会导致你第二个问题的提出，即关于进行两个属性查找的问题。

就你举的例子而言，进行两个元素的查找可能是这样的（使用 Gremlin）：

g.V('classname',"User").has('username','admin')

所以，您可以将顶点缩小到只有具有关键索引的“用户”顶点，然后筛选其中的“管理员”。但是，我会以不同的方式对其进行建模。更便宜的方法是只需执行以下操作：

graph.createKeyIndex("username",Vertex.class);
graph.getVertices("username", "admin");

或者在Gremlin中：

g.V('username','admin')

如果您知道所需的用户名，那么建模是没有更好/更快的方法。如果您仅想查找一个（或一组具有该用户名的顶点），则在该属性上进行关键索引是更好的方式，真正需要classname只是为了迭代所有“User”顶点。

即使我没有在其上创建关键索引，我仍然在所有顶点上包含一个type或classname属性。我发现这在全局操作中非常有用，可能并不关心速度，但只需要一个答案。