使用Scipy和Matplotlib将数据拟合到多模态分布

Question

使用Scipy和Matplotlib将数据拟合到多模态分布

pythonmatplotlibscipydistributionweibull

9

我有一个数据集，想要将其拟合到已知的概率分布中。目的是在数据生成器中使用拟合后的PDF，以便可以从已知（拟合）的PDF中抽取数据样本。数据将用于模拟目的。目前，我只是从正态分布中抽样，这与真实数据不一致，因此模拟结果不准确。

我最初想使用以下方法：如何使用Scipy（Python）将经验分布拟合到理论分布？我最初想将其拟合到韦伯分布，但数据实际上是多峰的（附图）。所以我想需要结合多个分布，然后将数据拟合到结果分布，对吗？也许结合高斯和韦伯分布？

我如何使用混合/多峰分布的scipy fit()函数？

此外，我希望在Python中完成这项工作（即使用scipy / numpy / matplotlib），因为数据生成器是用Python编写的。

非常感谢！

- Rosh

1个回答

网页内容由stack overflow 提供, 点击上面的

可以查看英文原文，
原文链接

- Elad Joseph · Accepted Answer

我建议使用核密度估计（KDE）。它会以概率密度函数的混合物形式给出解决方案。

SciPy 只有高斯核（对于您特定的直方图看起来不错），但是您可以在 statsmodels 或 scikit-learn 包中找到其他核函数。

参考下面这些相关函数：

from sklearn.neighbors import KernelDensity
from scipy.stats import gaussian_kde
from statsmodels.nonparametric.kde import KDEUnivariate
from statsmodels.nonparametric.kernel_density import KDEMultivariate

关于在Python中使用KDE的一个很好的资源在这里。