高效子图枚举算法

Question

高效子图枚举算法

algorithmgraph-algorithm

4

我已经搜索了与子图枚举相关的问题，但它们没有满足我的需求。如果我有误解，请告诉我。

是否有一种高效的算法或工具，用于枚举无向父图的所有“连接的、未标记的”子图。

在我的情况下，父图是互联网拓扑结构，因此节点数量可能很大。我想枚举父图中所有连接的未标记模式（即子图）。

我已经搜索了Efficiently find all connected subgraphs和Subgraph enumeration，但它们都针对顶点标记诱导和完全子图。但我只想要连接的未标记子图。

- taylrj

如果父图是顶点标记的（我所知道的所有计算机表示都是隐式顶点标记的），并且您想要仅生成不同的未标记子图，则需要多次解决NP完全的子图同构问题。（如果您从包含某些图的两个副本的父图开始，很容易看出这一点：对于第一个副本的任何子图，在考虑第二个副本的子图时，如何避免生成该子图第二次？） - j_random_hacker

@j_random_hacker - 在这个问题中，“未标记的子图”要求是由于我的目标图形是Internet拓扑结构的子网（即网络的图形）。与其他针对化学结构的问题相比[注]，我的问题可能是一个“未标记”的子图枚举问题，因为Internet上的任何节点都被认为是相同的，我只对它们的模式感兴趣。[注] 子图枚举链接 - taylrj

@j_random_hacker - 正如你所提到的，我知道可能不存在一个高效的算法，因为无法避免重复的子图同构测试。然而，我仍然想知道是否有任何想法可以解决这个问题。非常感谢任何评论。 - taylrj

1个回答

网页内容由stack overflow 提供, 点击上面的

可以查看英文原文，
原文链接

- gilleain · Accepted Answer

一个可能有帮助的主题名称是“频繁子图挖掘”，这似乎是此项工作的一种名称。该领域中有各种工具和算法，尽管它们可能不完全符合您的要求。

正如其他人在您链接的两个问题的答案中指出的那样，大型图的子图数量可能非常多。假设您实际上想要列出它们，而不仅仅是计数，那么可能需要很长时间。编辑：OP指出，此处的输入是一个大型图形，而不是一组较小的图形集，这将无法使用标准图形挖掘

我仍然认为一般方法在这里可以起作用。挖掘的图形输入集是数据图形的某些子图的子集。但是，这个子图集就是您首先想要的！

因此，假设您选择了一个所需的子图大小（假设为6个顶点），然后在父级（互联网拓扑）中随机选择起始顶点并“增长”这些种子，在每个增长步骤中淘汰不匹配的种子。然后为不同大小的子图重复此过程。

当然，这是一种概率算法，但它可以给您一些想法。