正态概率图解释

5
我有一个非常基础的问题。正态概率图的基础是什么,即这些概率代表什么?我正在测试标准正态分布。我的 normplot(在MATLAB中)显示的值大致在一条直线上,但概率0.5对应的值不为零。
我的问题是,我该如何解释这个结果?这是意味着我的数据服从正态分布但具有非零均值(即不是标准正态分布),还是这个概率只反映了其他内容?我尝试了谷歌搜索,其中一篇文章说这些概率是来自z-table的累积概率,但我无法理解其含义。
此外,在MATLAB中,只要数值符合程序绘制的线(红色虚线),这些值就来自正态分布吗?在我的某个图形中,虚线非常陡峭,但数值符合,这是否意味着那一两个明显偏离这条线的值只是异常值?
我对统计学非常陌生,请帮忙解答!
谢谢!


尝试访问http://math.stackexchange.com/ - Ben Voigt
2个回答

2
我的问题是,我该如何解释这个结果?这是否意味着我的数据服从正态分布但均值不为零(即不是标准正态分布),还是这个概率只反映了其他的东西?
你说得对。如果你运行 normplot 并得到非常接近拟合直线的数据,那么这意味着你的数据具有非常接近正态分布的 累积分布函数。0.5 CDF 点对应于拟合正态分布的平均值。(在你的情况下大约是 0.002)
你得到一条直线的原因是 y 轴是非线性的,并且被制作成“弯曲”以使一个完美的高斯累积分布能够映射成一条直线:y 轴标记是与逆 误差函数 线性相关的。
当你看到两端的斜率比拟合直线要陡峭时,这意味着你的分布尾部短于正态分布,即离群值较少,可能是由于某些物理限制防止了过多的偏离平均值。

0

正态分布是一种密度函数。任何单个值的概率都将为0。这是因为你有总概率(=1)在无限数量的值之间分布(它是一个连续函数)。

在正态分布图中,你所看到的是概率如何分布(y轴)在值周围(x轴)。因此,你可以从图表中获得一个区间的概率,无论是在两个点之间,从负无穷到任何点,还是从任何点到正无穷。这个概率是通过积分(正态分布函数)从点1到点2定义而得到的。

但是你不必做这个积分,因为你有z表。z表给出了x在[-无穷,x]之间的概率(应用将x与z相关联的方程)。

我这里没有matlab,但我猜你提到的直线是累积分布函数,它告诉你x在[-无穷,x]之间的概率,并由从-无穷到x值的总和(或在这种情况下的积分)确定(或在z表中获得)。

如果我的英语不好,请见谅。希望我能帮到你。


好的,那么为什么是一条直线呢?对于高斯分布来说,累积和会从负无穷增加到均值,然后以递减的速率继续增加,对吗?(因为钟形曲线)我不明白如何解释我的图表!我已经将它附在了我的问题上。 - Imelza
请检查http://psychology.wikia.com/wiki/Normal_distribution上的累积分布形状。 - Andre85
1
-1:这不是累积分布的图表。您可能会注意到y值的间距不均匀。正态图是一个“扭曲”的累积图,其中y值被间隔排列,以便正态分布(与输入数据具有相同的均值和标准差)呈直线。这使得可以轻松地识别输入与正态性之间的偏差。 - Jonas
当我回答这个问题时,它没有附加任何图像。您能否仅从他的问题中得出这一点? - Andre85

网页内容由stack overflow 提供, 点击上面的
可以查看英文原文,
原文链接