我有一个数据集,长这样:
我得到的结果与我所做分析的其他部分不一致。 我认为在使用“quantile”函数时,分位数的计算方式与简单地取最大值不同。
收入 | 财富 |
---|---|
10.000 | 100000 |
15.000 | 111000 |
14.200 | 123456 |
12.654 | 654321 |
我还有更多的行。
现在,我想要找出在特定财富百分位数下的家庭收入是多少。以下分位数是相关的:
c(0.01,0.05,0.1,0.25,0.5,0.75,0.9,0.95,0.99)
我一直使用以下代码来获取特定百分位数值:
a <- quantile(WEALTH, probs = c(0.01,0.05,0.1,0.25,0.5,0.75,0.9,0.95,0.99))
但是现在我想以财富为基础来计算百分位数,但要获取相应的收入。我尝试了以下代码,但结果不可信:
df$percentile = ntile(df$WEALTH,100)
df <- df[df$percentile %in% c(1,5,10,25,50,75,90,95,99), ]
a <- df %>%
group_by(percentile) %>%
summarise(max = max(INCOME))
我得到的结果与我所做分析的其他部分不一致。 我认为在使用“quantile”函数时,分位数的计算方式与简单地取最大值不同。
dput(df)
并将结果粘贴到您的问题中。谢谢! - zephryl