Scipy - 统计 - 概率分布参数的含义

6

Scipy 文档 给出了指数分布的表达式:

expon.pdf(x) = lambda * exp(- lambda*x)

然而,fit函数需要以下内容:
fit(data, loc=0, scale=1)

rvs函数需要:

rvs(loc=0, scale=1, size=1)

问题1: 为什么有这个多余的位置变量?我知道指数函数只是更普遍分布(伽马分布)的一种特殊形式,但为什么要包含不必要的信息?即使是伽马分布也没有位置参数。
问题2: fit(...)的输出顺序是否与输入变量相同?我的意思是如果我执行以下操作:
t = fit([....]) , t will have the form t[0], t[1]

我应该将t[0]解释为形状,t1解释为比例吗?这适用于所有分布吗?对于伽马分布呢?

fit(data, a, loc=0, scale=1)
1个回答

5
  1. 每个单变量概率分布,无论其通常的表述如何,都可以扩展到包括位置和比例参数。有时,这需要将分布的支持从仅正/非负实数扩展到整个实数线,当低于loc值时,只有PDF值为0。 scipy.stats这样做是为了将所有locscale的处理移动到所有分布共享的通用方法中。有人建议删除这个,使像gamma这样的分布无需loc来遵循它们的规范公式。然而,事实证明,有些人确实使用非零loc参数的“移位伽玛”分布来模拟太阳黑子的大小,如果我没记错的话,scipy.stats的当前行为对他们来说是完美的。所以我们保留它。

  2. fit()方法的输出是一个元组,形式为(shape0, shape1, ..., shapeN, loc, scale),如果有N个形状参数。对于没有形状参数的正态分布,它将返回(loc, scale)。对于具有一个形状参数的伽马分布,它将返回(shape, loc, scale)。多个形状参数将按照您在分布的每个其他方法中给出的顺序排列。这适用于所有分布。


3
请注意,如果您需要正确地拟合函数(在指数函数中不使用额外的参数loc),则应提供一个名为floc的参数(固定位置),并将其设置为0(要固定的位置的值)。 - EnricoGiampieri
非常正确!谢谢你提到这个。 - Robert Kern

网页内容由stack overflow 提供, 点击上面的
可以查看英文原文,
原文链接