我正在尝试在从宽格式到长格式收集列时保留其顺序。 我遇到的问题是在我进行了
以下是示例:
你可以看到它将
gather
和summarize
之后,顺序被打乱了。 由于列数很多,因此我不想手动输入顺序。以下是示例:
library(tidyr)
library(dplyr)
N <- 4
df <- data.frame(sample = c(1,1,2,2),
y1.1 = rnorm(N), y2.1 = rnorm(N), y10.1 = rnorm(N))
> df
sample y1.1 y2.1 y10.1
1 1 1.040938 0.8851727 -0.3617224
2 1 1.175879 1.0009824 -1.1352406
3 2 -1.501832 0.3446469 -1.8687008
4 2 -1.326817 0.4434628 -0.8795962
我想保留列的顺序。在进行一些操作后,顺序会丢失。如下所示:
dfg <- df %>%
gather(key="key", value="value", -sample) %>%
group_by(sample, key) %>%
summarize(mean = mean(value))
> filter(dfg, sample == 1)
sample key mean
<dbl> <chr> <dbl>
1 1 y1.1 0.2936335
2 1 y10.1 0.6170505
3 1 y2.1 -0.2250543
你可以看到它将
y10.1
放在了y2.1
的前面,这不是我想要的。我想要保留这个顺序,就像这样:dfg <- df %>%
gather(key="key", value="value", -sample)
> filter(dfg, sample == 1)
sample key value
1 1 y1.1 0.60171521
2 1 y1.1 -0.01444823
3 1 y2.1 0.81566726
4 1 y2.1 -1.26577581
5 1 y10.1 0.41686388
6 1 y10.1 0.81723707
出于某种原因,group_by
和summarize
操作会改变顺序。我不确定原因。我尝试使用ungroup
命令,但它没有起任何作用。正如我之前所说,我的实际数据框有许多列,我需要保留顺序。保留顺序的原因是为了能够以正确的顺序绘制数据。
有任何想法吗?