看了一些资料,我发现可以将预先计算好的距离矩阵传递给SKLearn DBSCAN。不幸的是,我不知道如何进行计算。
假设我有一个有100个元素的1D数组,只包含节点的名称。然后我有一个2D矩阵,100x100,其中包含每个元素之间的距离(按相同顺序排列)。
我知道必须调用:
db = DBSCAN(eps=2, min_samples=5, metric="precomputed")
对于节点之间的距离为2和最小5个节点聚类。此外,使用“precomputed”表示使用2D矩阵。但是我该如何传递计算信息呢?
如果使用RAPIDS CUML DBScan函数(GPU加速),则同样的问题也可能出现。