如何在R中将数据集转换为特定的方式

3

你能帮我解决这个问题吗?我有一个类似这样的数据集。

sample <- matrix(c(1, 'A', 0.17,
                   1, 'B', 0.80,
                   1, 'C', 0.10,
                   1, 'D', 0.35,
                   2, 'A', 0.44,
                   2, 'B', 0.24,
                   2, 'C', 0.39,
                   2, 'D', 0.65,
                   3, 'A', 0.61,
                   3, 'B', 0.94,
                   3, 'C', 0.19,
                   3, 'D', 0.65), nrow=12, ncol=3, byrow=T)

colnames(sample) <- c('year', 'country', 'X')
as.data.frame(sample)

输出

   year country    X
1     1       A 0.17
2     1       B  0.8
3     1       C  0.1
4     1       D 0.35
5     2       A 0.44
6     2       B 0.24
7     2       C 0.39
8     2       D 0.65
9     3       A 0.61
10    3       B 0.94
11    3       C 0.19
12    3       D 0.65


需要什么技巧才能得到像以下这样的数据集?
year    A     B       C       D
1   0.17    0.80    0.10    0.35
2   0.44    0.24    0.39    0.65
3   0.61    0.94    0.19    0.65

4个回答

0

你的代码缺少前一两行,所以我进行了一些重新格式化。这里是一个使用 tidyr 的解决方案:

library(dplyr)
library(tidyr)
df <- read.table(text = 
      "1,  'A',    0.17
       1,  'B',    0.80
       1,  'C',    0.10
       1,  'D',    0.35
       2,  'A',    0.44
       2,  'B',    0.24
       2,  'C',    0.39
       2,  'D',    0.65
       3,  'A',    0.61
       3,  'B',    0.94
       3,  'C',    0.19
       3,  'D',    0.65", sep = ",", strip.white = TRUE)

colnames(df)<-c('year', 'country',  'X')

df %>%
  arrange(year, country) %>%
  pivot_wider(names_from = country, values_from = X)
#> # A tibble: 3 x 5
#>    year     A     B     C     D
#>   <int> <dbl> <dbl> <dbl> <dbl>
#> 1     1  0.17  0.8   0.1   0.35
#> 2     2  0.44  0.24  0.39  0.65
#> 3     3  0.61  0.94  0.19  0.65

reprex软件包(v0.3.0)于2020-04-10创建


很高兴你觉得有帮助,欢迎来到 Stack Overflow!如果问题已经解决,请考虑接受其中一个答案(点击勾选标记)。 - RyanFrost

0
你想要实现的是将数据集从长格式转换为宽格式。
使用reshape包,以下代码可以实现:
d_long <- melt(yourdatasetname, id.vars = c("year"))
d_wide <- dcast(d_long, year ~ country, sum)

0
参考ColorStatistics的回答,数据集已经以融合形式呈现。只需要执行dcast即可。
> data<-as.data.frame(sample)
> library(data.table)
> dtable <- dcast(data = data, year~country) 
> dtable
      year    A    B    C    D
1    1 0.17  0.8  0.1 0.35
2    2 0.44 0.24 0.39 0.65
3    3 0.61 0.94 0.19 0.65

0

一个基本的R选项是使用reshape,如下所示

dfout <- reshape(df,
                 direction = "wide",
                 idvar = "year",
                 timevar = "country")

这样

> dfout
  year  X.A  X.B  X.C  X.D
1    1 0.17  0.8  0.1 0.35
5    2 0.44 0.24 0.39 0.65
9    3 0.61 0.94 0.19 0.65

网页内容由stack overflow 提供, 点击上面的
可以查看英文原文,
原文链接