逻辑回归 - glm中的cbind命令

22

我正在R中做逻辑回归。有人能否澄清一下运行这两行代码有什么区别?

1. glm(Response ~ Temperature, data=temp, 
                    family = binomial(link="logit"))
2. glm(cbind(Response, n - Response) ~ Temperature, 
                    data=temp, family =binomial, Ntrials=n)

数据看起来像这样:
(注意:响应是二进制的。0=死亡,1=未死亡)

Response  Temperature
0         24.61
1         39.61
1         39.50
0         22.71
0         21.61
1         39.70
1         36.73
1         33.32
0         21.73
1         49.61

保罗...第一行很容易理解。 :)。我试图弄清楚第二个,因为R中有些例子使用它。并且这两个生成不同的结果。 :) - Eddie
4
我认为@James是正确的。如果n等于1,那么在这种情况下你应该得到完全相同的答案。一般来说,当每个观测值有多次试验时,你应该使用第二种形式。据我所知,“Ntrials”参数是虚假/不必要的。 - Ben Bolker
非常感谢你,本。你能否进一步解释一下“每个观察值多于一个试验”的含义?:) - Eddie
4
假设你的数据被分组,以至于你在每个温度值上都测量了多个个体(比如10个),例如在温度值为22.71时有7个个体存活。因此,你的估计将基于二项试验结果,即在N=10次试验中,有概率为p的7个个体存活。通常人们说“逻辑回归”时指的是未分组数据(N=1),而将“二项回归”保留给分组情况,但这些术语在某种程度上是可以互换的... - Ben Bolker
1个回答

20
在进行二项式或准二项式的glm时,您可以提供成功的概率、一个两列矩阵,其中每列都给出了成功和失败的数量,或者一个因子,其中第一个水平表示等式左侧的失败,其余表示成功。详见?glm。

9
请注意,在使用二项式广义线性模型的频率形式时,您应在weights参数中提供每次试验的观测值数量。它看起来像这样:glm(events/n ~ x, data=*, weights=n, ...) - Hong Ooi

网页内容由stack overflow 提供, 点击上面的
可以查看英文原文,
原文链接