我使用read.table
将5个文本数据集输入R中。每个数据集具有相同的结构(100行,50列)。
我想将这五个表格联合/追加到一个表格中,该表格将是500行*50列。
有人知道如何做到这一点吗?
我使用read.table
将5个文本数据集输入R中。每个数据集具有相同的结构(100行,50列)。
我想将这五个表格联合/追加到一个表格中,该表格将是500行*50列。
有人知道如何做到这一点吗?
来自包 dplyr
:
install.packages('dplyr')
library(dplyr)
new_df <- bind_rows(table1, table2, table3, table4, table5)
bind_rows
比rbind
更高效。 - Psidom在基础R中,你可以执行以下操作:
# Create some toy data first
nc <- 50
nr <- 1000
# Create five tables with nc columns and nr rows.
df1 <- as.data.frame(replicate(nc, rnorm(nr)))
df2 <- as.data.frame(replicate(nc, rnorm(nr)))
df3 <- as.data.frame(replicate(nc, rnorm(nr)))
df4 <- as.data.frame(replicate(nc, rnorm(nr)))
df5 <- as.data.frame(replicate(nc, rnorm(nr)))
# Join the tables
df <- rbind(df1, df2, df3, df4, df5)
dim(df)
#[1] 5000 50
如果您需要的是5个叠在一起的表格,那么这将为您提供。如果不是,请至少提供一个说明您问题的示例。
即使对于这个特定问题来说没有关系,但比较不同的rbind方法仍然有帮助。下面是从base、data.table和dplyr中比较三种rbind方法的内容;
> dim(df)
[1] 16777216 2
> microbenchmark(rbind(df,df), rbindlist(list(df,df)), bind_rows(df,df), times = 10)
Unit: milliseconds
expr min lq mean median uq max neval cld
rbind(df, df) 3824.4208 4052.6405 4288.5569 4239.2416 4557.5736 4685.2155 10 c
rbindlist(list(df, df)) 272.5048 304.8365 348.0393 357.4388 390.7684 405.0778 10 a
bind_rows(df, df) 571.1732 596.2556 715.1572 643.8038 863.5805 927.0341 10 b