以下是简单数据集的内容;
以下代码:
row country year
1 NLD 2005
2 NLD 2005
3 BLG 2006
4 BLG 2005
5 GER 2005
6 NLD 2007
7 NLD 2005
8 NLD 2008
以下代码:
df[, .N, by = list(country, year)][,prop := N/sum(N)]
给出了相对于总观测量的观测比例。然而,我想要衡量每个国家的比例。我应该如何修改此代码以给出正确的比例?
期望输出:
row country year prop
1 NLD 2005 0.6
2 NLD 2005 0.6
3 BLG 2006 0.5
4 BLG 2005 0.5
5 GER 2005 1
6 NLD 2007 0.2
7 NLD 2005 0.6
8 NLD 2008 0.2
df[, {ty <- table(year); .(prop=as.vector(ty)/sum(ty), year=names(ty))}, by=country]
- Cath