在Matplotlib中，我可以使用多个CPU加速绘制多个subplot和数据点吗？

Question

在Matplotlib中，我可以使用多个CPU加速绘制多个subplot和数据点吗？

pythonmatplotlibmultiprocessingpython-multiprocessingjoblib

4

我正在创建一个包含大约一百个子图/坐标轴的图形，每个子图都有几千个数据点。目前，我正在循环遍历每个子图，并使用plt.scatter放置数据点。然而，这样做速度很慢。是否可以使用多个CPU来加快绘图速度，将工作分成每个子图一个核心或在单个子图中绘制数据点方面进行划分？

到目前为止，我尝试使用joblib来使用并行进程进行子图创建，但它不是在同一图中创建新的子图，而是为每个子图生成一个新的图。我已经尝试过后端PDF、Qt5Agg和Agg。以下是我的代码简化示例。

import matplotlib as mpl
mpl.use('PDF')
import seaborn as sns
import matplotlib.pyplot as plt
from joblib import Parallel, delayed

def plotter(name, df, ax):
    ax.scatter(df['petal_length'], df['sepal_length'])

iris = sns.load_dataset('iris')
fig, axes = plt.subplots(3,1)

Parallel(n_jobs=2)(delayed(plotter)
    (species_name, species_df, ax)
    for (species_name, species_df), ax in zip(iris.groupby('species'), axes.ravel()))

fig.savefig('test.pdf')

设置n_jobs=1可以工作，所有点都在同一幅图中绘制。然而，将其增加到1以上会创建四个图：一个由plt.subplots初始化，每次调用ax.scatter时都会创建一个新的图。

由于我将第一个图的轴传递给plotter，所以我不确定为什么会创建额外的图形。是否有一些matplotlib中的回退机制，如果指定的图形由另一个绘图过程“锁定”，则会自动创建新的图形？

欢迎提供任何关于如何改进我的当前方法或通过其他方法获得加速的建议。

- joelostblom

1个回答

网页内容由stack overflow 提供, 点击上面的

可以查看英文原文，
原文链接

- J. P. Petersen · Accepted Answer

Joblib的parallel使用模块来生成进程，因此每个作业将在不同的进程中运行。这就是为什么您会为每个作业获得一个新的图形。这些进程不像线程那样共享任何内存，因此它们无法访问原始图形。

您可能可以尝试使用线程，但由于全局解释器锁（GIL），您是否能获得任何速度提升是值得怀疑的。

为了加速绘图，您可以尝试避免使用pyplot。它会添加一些开销和一个辅助线程，在每个绘制命令后重新绘制图形。这主要面向使ipython感觉更像Matlab之类的用途，但对于速度来说这很糟糕。如果只使用matplotlib，则可以选择仅在完成绘图时绘制图形，并且这可能会节省相当多的时间。

注意：@Faultier在评论中提到，您可以使用pyplot.ion()和pyplot.ioff()启用和禁用交互式绘图。