以下情景简化了我的实际情况:
我的数据来自村庄,我想通过村庄变量总结一个结果变量。
> data
village A Z Y
<chr> <int> <int> <dbl>
1 a 1 1 500
2 a 1 1 400
3 a 1 0 800
4 b 1 0 300
5 b 1 1 700
例如,我想仅通过村庄使用
Z==z
计算Y
的均值。在这种情况下,我希望村庄"a"的结果为(500 + 400)/2 = 450 ,村庄"b"的结果为700。请注意,实际情况更加复杂,不能直接使用此答案,但关键是我需要将分组后的表格和全局变量(z)传递给我的函数。
z <- 1 # z takes 0 or 1
data %>%
group_by(village) %>% # grouping by village
summarize(Y_village = Y_hat_village(., z)) # pass a part of tibble and a global variable
Y_hat_village <- function(data_village, z){
# This function takes a part of tibble (`data_village`) and a variable `z`
# Calculate the mean for a specific z in a village
data_z <- data_village %>% filter(Z==get("z"))
return(mean(data_z$Y))
}
然而,我发现
.
会传递整个tibble,上面的代码对于所有组返回相同的值。
do
,你也可以考虑使用split
然后map
。 - moodymudskipper