我正在构建一个ArangoDB边缘集合,其中包含许多“类型”。按类型分类,可以将其视为动物物种分类法。
我将构建一个连接所有这些内容的图形。例如:古代人类物种的父/子关系:Homo habilis->Homo floresiensis->Homo erectus->Homo sapiens
将不同类型放在不同的集合中只是为了表面上的组织原因。有一种很小的可能性,未来它可能对我尚未想到的功能有用。
我的具体问题是:在ArangoDB中构建使用多个集合的图形是否会影响性能?对于图形,使用一个大集合是否更有效?
回答第一个评论:
如果我将其拆分为不同的边缘集合,则每个集合将有约30万行。类型可以有多个父项和子项。查询类型将是最短路径和每个之间的任何连通性。如果这有意义的话?就像Kevin Bacon的六度分离那样。
编辑:
请参阅评论以获取一些问题和答案。几乎每个查询都将跨越多个类型。许多查询将深入5-7个顶点。这个项目几乎完全是读取...我一点也不担心写入速度。
编辑2:
我会使用单个实例还是分布式集群?老实说,两者都可以!告诉我哪个可以加快读取速度。
我将构建一个连接所有这些内容的图形。例如:古代人类物种的父/子关系:Homo habilis->Homo floresiensis->Homo erectus->Homo sapiens
将不同类型放在不同的集合中只是为了表面上的组织原因。有一种很小的可能性,未来它可能对我尚未想到的功能有用。
我的具体问题是:在ArangoDB中构建使用多个集合的图形是否会影响性能?对于图形,使用一个大集合是否更有效?
回答第一个评论:
如果我将其拆分为不同的边缘集合,则每个集合将有约30万行。类型可以有多个父项和子项。查询类型将是最短路径和每个之间的任何连通性。如果这有意义的话?就像Kevin Bacon的六度分离那样。
编辑:
请参阅评论以获取一些问题和答案。几乎每个查询都将跨越多个类型。许多查询将深入5-7个顶点。这个项目几乎完全是读取...我一点也不担心写入速度。
编辑2:
我会使用单个实例还是分布式集群?老实说,两者都可以!告诉我哪个可以加快读取速度。