方差与变异系数

3

我需要确定哪个统计量能帮助我在数字图像中找到变化最大的那条线。我正在使用方差(以平方单位计算,计算方法为numpy.var(x))和变异系数(无单位,计算方法为numpy.sd(x)/numpy.mean(x)),但我得到了不同的值,如下所示:

v1 = line(VAR(x)) 

v2 = line(CV(x))

print(v1,v2)

结果:

(12,17)

这两个应该不会找到同一行,哪一个在这种情况下更好使用呢?

你在http://stats.stackexchange.com/上可能会更加幸运。 - msw
我有些困惑。这是一个编程问题还是统计问题?如果这是一个编程问题,请进一步说明这个编程问题是什么。 - starball
2个回答

7

变异系数和方差不应选择随机数据中的同一数组。变异系数对您的数据的方差和比例尺都会敏感,而方差则更加关注数据的变化。

请参见以下示例:

import numpy as np

x = np.random.randn(10)
x1= x+10
np.var(x), np.std(x)/np.mean(x)

(2.0571740850649021, -2.2697110381499224)

np.var(x1), np.std(x1)/np.mean(x1)

(2.0571740850649016, 0.1531035017615747)

选择哪一个取决于您的应用程序,但在您的情况下,我倾向于使用方差。


@Sergey_Bushmanov 我理解你的观点,那么在我的情况下,似乎 C.V. 更有用;因为我对规模很感兴趣,但是你能否给我更多信息,为什么 C.V 对规模更敏感?提前致谢。 - Bayes
就我对图像的了解而言,C.V. 不仅会受到方差本身的影响,还会受到这个方差是否发生在白色或黑色像素上的影响(参见上面的例子)。就我理解你的问题而言,你关心的是方差,而不是它是否发生在白色或黑色像素上。这就是为什么我建议使用方差。但无论如何,最终决定权在你手中。我的帖子的主要目的是展示方差和 C.V. 可能会产生不同结果的原因。 - Sergey Bushmanov
@Sergey_Bushmanov 谢谢你,你给了我有趣的观点,在我选择其中之一之前进行分析。 - Bayes

0
  1. 方差定义了数据与平均值(数据无噪声)或中位数(数据有噪声)之间的差异程度。

  2. 变异系数定义为标准差除以平均值,通常以百分比表示。


网页内容由stack overflow 提供, 点击上面的
可以查看英文原文,
原文链接