svyglm和加权glm的区别

5
我想知道使用svyglm和加权glm之间的区别。
例如:
M1 = glm(formula = yy ~ age + gender + country , 
         family = binomial(link = "probit"), 
         data = P2013, 
         subset = (P2013$E27>=14 & P2013$E27<=17), 
         weights = P2013$PESOANO)

或者将样本设计定义为:
diseño = svydesign(id =~ NUMERO, 
                   strata =~ ESTRATOGEO, 
                   data = p2013, 
                   weights = P2013$PESOANO)

diseño_per_1417 = subset(diseño, (P2013$E27>=14 & P2013$E27<=17))

然后使用svyglm

M2 = svyglm(formula = yy ~ age + gender + country, 
            family = quasibinomial(link = "probit"),
            data = P2013, 
            subset = (stratum=!0), 
            design = diseño_per_1417)

如果我使用 M2 (svyglm),那么在比较模型方面,我可以使用什么来像逐步回归模型一样比较 glm 模型呢?

谢谢, Natalia

1个回答

3

来自help(glm):

非NULL权重可用于指示不同观测具有不同的离散度(权重中的值与离散度成反比);或等效地,当权重的元素是正整数w_i时,每个响应y_i是w_i个单位权重观测的平均值。对于二项式GLM,先验权重用于在响应为成功比例时给出试验次数:它们很少用于泊松GLM。

我认为你不需要那些权重。从你的示例中看起来,你正在处理分层调查。你应该一定要使用surveyglm


谢谢Florian!但是你知道svyglm使用哪个估算器吗?或者我在哪本书中可以找到开发的资料? - Natuk
2
svyglm执行与您的设计相关的一些工作(权重,分层等),但最终调用glm。因此,您应该查看?glm。基本上,通过在您的示例中指定family,您设置了要使用的链接函数(对应于“logit”或“probit”等)。Kleiber&Zeileis 2008(p122)提供了简明的解释。还请查看调查包的[网站](http://staff.washington.edu/tlumley/survey/)。如果您认为这有帮助,请接受我的答案。 - Florian Oswald
1
是的,我已经查阅了不同的书籍和调查包,但我找不到svyglm使用的估计器。我认为svyglm没有使用最大似然估计,可能是Horvitz Thomson估计器?我想找到一篇详细解释的文章。谢谢! - Natuk

网页内容由stack overflow 提供, 点击上面的
可以查看英文原文,
原文链接