Scipy - 统计 - 概率分布参数的含义

Question

6

Scipy 文档给出了指数分布的表达式:

expon.pdf(x) = lambda * exp(- lambda*x)

然而，fit函数需要以下内容：

fit(data, loc=0, scale=1)

rvs函数需要：

rvs(loc=0, scale=1, size=1)

问题1：为什么有这个多余的位置变量？我知道指数函数只是更普遍分布（伽马分布）的一种特殊形式，但为什么要包含不必要的信息？即使是伽马分布也没有位置参数。

问题2： fit（...）的输出顺序是否与输入变量相同？我的意思是如果我执行以下操作：

t = fit([....]) , t will have the form t[0], t[1]

我应该将t[0]解释为形状，t1解释为比例吗？这适用于所有分布吗？对于伽马分布呢？

fit(data, a, loc=0, scale=1)

- bearrito

1个回答

网页内容由stack overflow 提供, 点击上面的

可以查看英文原文，
原文链接

- Robert Kern · Accepted Answer

每个单变量概率分布，无论其通常的表述如何，都可以扩展到包括位置和比例参数。有时，这需要将分布的支持从仅正/非负实数扩展到整个实数线，当低于loc值时，只有PDF值为0。 scipy.stats这样做是为了将所有loc和scale的处理移动到所有分布共享的通用方法中。有人建议删除这个，使像gamma这样的分布无需loc来遵循它们的规范公式。然而，事实证明，有些人确实使用非零loc参数的“移位伽玛”分布来模拟太阳黑子的大小，如果我没记错的话，scipy.stats的当前行为对他们来说是完美的。所以我们保留它。
fit()方法的输出是一个元组，形式为(shape0, shape1, ..., shapeN, loc, scale)，如果有N个形状参数。对于没有形状参数的正态分布，它将返回(loc, scale)。对于具有一个形状参数的伽马分布，它将返回(shape, loc, scale)。多个形状参数将按照您在分布的每个其他方法中给出的顺序排列。这适用于所有分布。