当我在使用sklearn
聚类算法时,使用自定义距离度量函数遇到了性能瓶颈。
通过Run Snake Run显示的结果如下:
很明显问题出现在dbscan_metric
函数中。这个函数看起来非常简单,我并不知道加速它的最佳方法是什么:
def dbscan_metric(a,b):
if a.shape[0] != NUM_FEATURES:
return np.linalg.norm(a-b)
else:
return np.linalg.norm(np.multiply(FTR_WEIGHTS, (a-b)))
任何关于导致速度缓慢的想法,将不胜感激。