我正在尝试从一份计数数据的数据帧中创建一个未汇总的数据帧。
我有一些经验在创建样本数据集方面,但是我在尝试获取每个州/人的特定行数和比例时遇到了一些麻烦,而不是分别对它们进行编码,然后将它们组合起来。 我能够使用以下代码完成此操作,但我感觉还有更好的方法。
我不希望你替我写代码,但非常希望能得到有用的函数或示例想法。
我有一些经验在创建样本数据集方面,但是我在尝试获取每个州/人的特定行数和比例时遇到了一些麻烦,而不是分别对它们进行编码,然后将它们组合起来。 我能够使用以下代码完成此操作,但我感觉还有更好的方法。
set.seed(2312)
dragon <- sample(c(1),3,replace=TRUE)
Maine <- sample(c("Maine"),3,replace=TRUE)
Maine1 <- data.frame(dragon, Maine)
dragon <- sample(c(0),20,replace=TRUE)
Maine <- sample(c("Maine"),20,replace=TRUE)
Maine2 <- data.frame(dragon, Maine)
Maine2
library(dplyr)
maine3 <- bind_rows(Maine1, Maine2)
有没有更好的方法来生成这个数据集而不是上面的代码?
我正在尝试从以下计数数据创建数据帧:
+-------------+--------------+--------------+
| | # of dragons | # no dragons |
+-------------+--------------+--------------+
| Maine | 3 | 20|
| California | 1 | 10|
| Jocko | 28 | 110515 |
| Jessica Day | 17 | 26122 |
| | 14 | 19655 |
+-------------+--------------+--------------+
我希望它看起来像这样:
+-----------------------+---------------+
| | Dragons (1/0) |
+-----------------------+---------------+
| Maine | 1 |
| Maine | 1 |
| Maine | 1 |
| Maine | 0 |
| Maine….(2:20) | 0…. |
| California | 1 |
| California….(2:10) | 0… |
| Ect.. | |
+-----------------------+---------------+
我不希望你替我写代码,但非常希望能得到有用的函数或示例想法。
tidyr
加载maine3 %>% count(Maine, dragon) %>% spread(dragon, n)
。 - Frank