我正在使用
这让我想到我的第一个问题:如果我有每个收入分位数的复制权重误差,如何计算收入分位数比率(例如90/10)的标准误差?我尝试使用
第二个问题:是否有一种方法可以使用现有函数(如
这将导致以下错误消息:
survey
软件包处理美国社区普查微观数据,并希望计算一些基本的收入不平等统计信息。我已经按照以下方式设置了我的设计:testsurv <- svrepdesign(data=test, repweights = test[,8:87], weights = test$HHWT,
combined.weights=TRUE, type = "Fay", rho = 0.5,scale=4/80,
rscales = rep(1, 80), mse=TRUE)
基于此,我希望能够按年份计算基尼系数以及收入分位数比率。使用 svyby
和 svyquantile
生成分位数和相关误差非常容易:
quants <- svyby(~INCOME, ~YEAR, testsurvey, svyquantile,
quantiles=c(0.9, 0.75, 0.5, 0.25, 0.1), keep.var=TRUE)
这让我想到我的第一个问题:如果我有每个收入分位数的复制权重误差,如何计算收入分位数比率(例如90/10)的标准误差?我尝试使用
svyratio
,但那是针对整个变量的比率,而不是变量中所选观测值的比率。第二个问题:是否有一种方法可以使用现有函数(如
reldist
中的gini
)在survey
中计算基于复制的gini系数?我尝试使用withReplicates
,但效果不佳,可能是因为gini
将其参数排序为变量,然后权重,但withReplicates
的说明指定相反的顺序。我尝试了两种方式,但都没有成功。例如,在这个例子中,HHWT是样本权重:> withReplicates(testsurv, gini(~HHWT, ~INCOME))
这将导致以下错误消息:
Error in sum(weights) : invalid 'type' (language) of argument
In addition: Warning message:
In is.na(x) : is.na() applied to non-(list or vector) of type 'language'