我对P值的概念感到困惑。通常情况下,如果P值大于0.05的阈值α,我们无法拒绝零假设;如果P值小于α,则拒绝零假设。据我所知,如果P值大于α,则两组之间的差异仅来自抽样误差或偶然性。到目前为止一切都好。然而,如果P值小于α,结果就是统计显著,而我本以为它是统计不显著(因为,在P值小于α的情况下,我们拒绝零假设)。
基本上,如果结果具有统计意义,我们拒绝零假设。但是,如果它具有统计意义,如何拒绝假设呢?从“统计显著”这个词来看,我理解这个结果是好的。
我对P值的概念感到困惑。通常情况下,如果P值大于0.05的阈值α,我们无法拒绝零假设;如果P值小于α,则拒绝零假设。据我所知,如果P值大于α,则两组之间的差异仅来自抽样误差或偶然性。到目前为止一切都好。然而,如果P值小于α,结果就是统计显著,而我本以为它是统计不显著(因为,在P值小于α的情况下,我们拒绝零假设)。
基本上,如果结果具有统计意义,我们拒绝零假设。但是,如果它具有统计意义,如何拒绝假设呢?从“统计显著”这个词来看,我理解这个结果是好的。
你误解了P值中“显著性”的含义。
我会在下面尝试解释:
假设有一个测试,测试两个总体的均值是否相等。我们将通过从每个总体中抽取一个样本并计算P值来执行T检验。
零假设和备择假设:
H0: m1 - m2 = 0
H1: m1 - m2 != 0
这是一个双侧检验(虽然对此并不重要)。
假设您得到了一个p值为0.01
,而您的α值为0.05。P值是从两个总体(m1和m2)中抽样时平均数相等的概率。这意味着只有1%的概率会出现平均差为0的样本对,也就是说只有100个样本对中才有1个样本对的平均差为0。
两个均值相等的概率如此之低,使我们有信心(确信)认为这两个总体的均值不相等,因此我们认为结果在统计学上具有显著性。
那么使我们认为结果具有显著性的阈值是多少呢?这由显著性水平(a)确定,在这种情况下为5%。
P值小于显著性水平是使我们认为结果具有显著性的原因,因此我们确信可以拒绝零假设,因为零假设为真的概率非常低。
希望现在解释清楚了!
对于p值,您至少应该了解零假设和备择假设。零假设意味着我们举个例子,有两朵花,它表明它们之间没有显著差异,而备择假设则表明它们之间存在显著差异。
对于p值的显著性水平,大多数数据科学家将其视为0.05,但这是基于研究(显著性水平)的价值。可取为P值的值: 0.5 0.05 0.01 0.001
现在你已经得到了p值,接下来该怎么办?
您的模型的p值<显著水平,则拒绝它