我正在使用sklearn包中的K-Means聚类算法。
虽然我按照sklearn文档的说明设置了参数n_jobs = 1
,并且只有一个进程在运行,但是这个进程将消耗我的计算机上所有的CPU。也就是说,在top
命令中,我可以看到Python进程使用了,比如说4核机器上的400%。
需要明确的是,如果我设置n_jobs = 2
,那么我会得到两个Python实例,但是每个实例都使用200%的CPU,再次消耗我的计算机全部4个核心。
我认为问题可能出在NumPy/SciPy的并行化层面。
是否有一种方法可以验证我的假设?例如,是否有一种方法可以关闭NumPy/SciPy中的任何并行化?