将分布拟合到直方图上

Question

将分布拟合到直方图上

8

我想知道我的数据点分布情况，所以首先绘制了数据的直方图。我的直方图如下所示： my histogram

其次，为了将它们拟合到一个分布上，我编写了以下代码：

size = 20000
x = scipy.arange(size)
# fit
param = scipy.stats.gamma.fit(y)
pdf_fitted = scipy.stats.gamma.pdf(x, *param[:-2], loc = param[-2], scale = param[-1]) * size
plt.plot(pdf_fitted, color = 'r')

# plot the histogram
plt.hist(y)

plt.xlim(0, 0.3)
plt.show()

结果如下：

结果为：

输入图片描述

我做错了什么？

- aloha

1个回答

网页内容由stack overflow 提供, 点击上面的

可以查看英文原文，
原文链接

- unutbu · Accepted Answer

您的数据似乎不符合伽玛分布，但是如果假设它符合，可以按照以下方式进行拟合：

import numpy as np
import scipy.stats as stats
import matplotlib.pyplot as plt

gamma = stats.gamma
a, loc, scale = 3, 0, 2
size = 20000
y = gamma.rvs(a, loc, scale, size=size)

x = np.linspace(0, y.max(), 100)
# fit
param = gamma.fit(y, floc=0)
pdf_fitted = gamma.pdf(x, *param)
plt.plot(x, pdf_fitted, color='r')

# plot the histogram
plt.hist(y, normed=True, bins=30)

plt.show()

在此输入图片描述

概率密度函数下的面积（在整个定义域上）等于1。如果使用normed=True，则直方图下的面积也等于1。
x的长度为size（即20000），pdf_fitted与x具有相同的形状。如果我们调用plot并仅指定y值，例如plt.plot(pdf_fitted)，则值将在x范围[0，size]上绘制。这个x范围太大了。由于直方图将使用x范围[min(y)，max(y)]，因此我们必须选择跨越类似范围的x：x = np.linspace(0,y.max())，然后指定x和y值调用plot，例如plt.plot(x,pdf_fitted)。
正如Warren Weckesser在评论中指出的那样，对于大多数应用程序，伽马分布的定义域从0开始。如果是这种情况，请使用floc=0将loc参数设置为0。如果没有floc=0，则gamma.fit也会尝试找到最佳的loc参数值，但是由于数据的不确定性，一般不会恰好为零。