我该如何使用dplyr为每个州创建因子变量的水平比例?例如,我想要添加一个变量,指示每个州内女性所占的百分比至数据框中。
# gen data
state <- rep(c(rep("Idaho", 10), rep("Maine", 10)), 2)
student.id <- sample(1:1000,8,replace=T)
gender <- rep( c("Male","Female"), 100*c(0.25,0.75) )
gender <- sample(gender, 40)
school.data <- data.frame(student.id, state, gender)
以下是一种我知道是错误的尝试,但可以让我访问信息:
middle %>%
group_by(state, gender %in%c("Female")) %>%
summarise(count = n()) %>%
mutate(test_count = count)
我在使用count和mutate函数时遇到了困难,这使得进一步的操作变得困难。它的行为不符合我的预期。