我正在使用R处理一个特定课程中学生所获得的字母成绩等级作为响应变量。该变量是有序的,并且在我看来似乎是比例关系。
我的理解是,在使用polr()而不是multinom()之前,需要测试它是否成比例关系。对于我的数据中的一门课程,我像这样“测试”了比例性:
为了测试比例几率假设的第二种方法,我还运行了两个vglm模型,一个使用
除了上述两个测试之外,我还将我的累积概率与每个预测变量单独绘制在图表中。我读到要使这些线是平行的。我不明白的是,使用
我通过观看Chris Bilder的YouTube课程学习了基础知识;他在第42分钟这里谈到了平行图形。
感谢您的帮助!
我的理解是,在使用polr()而不是multinom()之前,需要测试它是否成比例关系。对于我的数据中的一门课程,我像这样“测试”了比例性:
M1 <- logLik(polrModel) #'log Lik.' -1748.180691 (df=8)
M2 <- logLik(multinomModel) #'log Lik.' -1734.775727 (df=20)
G <- -2*(M1$1 - M2$2)) #I used a block bracket here in the real code
# 26.8099283
pchisq(G,12,lower.tail = FALSE) #DF is #of predictors
#0.008228890393 #THIS P-VAL TELLS ME TO REJECT PROPORTIONAL
为了测试比例几率假设的第二种方法,我还运行了两个vglm模型,一个使用
family=cumulative(parallel=TRUE)
,另一个使用family=cumulative(parallel=FALSE)
。然后,我使用模型差异和残余自由度差异运行了测试。
这两种方法是否可信?如果不是,请帮助我编写实际的代码来确定是否接受或拒绝比例几率假设!除了上述两个测试之外,我还将我的累积概率与每个预测变量单独绘制在图表中。我读到要使这些线是平行的。我不明白的是,使用
polr()
,您的输出是每个独立变量的单个斜率(系数),然后是特定截距,具体取决于您正在处理的累积概率(例如:P(Y<=A)、P(Y<=B)等)。因此,如果每个方程的斜率系数都相同,那么这些线怎么可能不是平行的呢?我通过观看Chris Bilder的YouTube课程学习了基础知识;他在第42分钟这里谈到了平行图形。
感谢您的帮助!