我有一个包含来自三个不同项目的 9558 行数据的数据集。我想要将这个数据集随机分成三组,并为每组分配一个唯一的ID,使得
我尝试了很多方法,并从与我的问题类似的人的代码中搜索了解决方案。我使用了
下面是我制作的一个数据集示例:
Project1_Project_2_Project3
变成 Project1
、Project2
和 Project3
。我尝试了很多方法,并从与我的问题类似的人的代码中搜索了解决方案。我使用了
sample_n()
和 sample_frac()
,但是,可惜我无法自己解决这个问题 :/下面是我制作的一个数据集示例:
ProjectName <- c("Project1_Project2_Project3")
data <- data.frame(replicate(10,sample(0:1,9558,rep=TRUE)))
data <- data.frame(ProjectName, data)
输出结果应该随机分成三个相等的组,每组 nrow=3186
的值。
ProjectName Count of rows
Project1 3186
Project2 3186
Project3 3186
c("Project1", "Project2", "Project3")
代替c("Project1_Project2_Project3")
能得到你想要的结果吗? - jay.sf