我正在尝试在R中组合多个CSV文件,以便进行一些预测建模。虽然每个文件具有相同的列且这些列的顺序相同,但某些列的名称不同。迄今为止,我的代码将文件组合得很好并剥离了标题。然而,我现在需要它添加另外两列来标识每个CSV文件的日期。每个CSV的文件名包含日期。
文件名格式如下:'January 2017','February 2017','March 2017',等等。
所以我希望这两列分别表示月份和年份。
以下是我到目前为止使用的代码。它将所有CSV组合成一个,但没有创建我需要的两个额外列。
文件名格式如下:'January 2017','February 2017','March 2017',等等。
所以我希望这两列分别表示月份和年份。
以下是我到目前为止使用的代码。它将所有CSV组合成一个,但没有创建我需要的两个额外列。
dat <- setwd('C:/Users/ . . . /Historical Data')
file_names <- dir(dat)
dataset <- do.call(rbind, lapply(file_names, read.csv, skip = 1, header = FALSE))
dataset <- do.call(rbind, lapply(file_names, read.csv, header = FALSE, function(x) cbind(read.csv(x), name=strsplit(x,'\\.')[[1]][1])))
head(dataset)
有没有人能够指导我如何最好地将这两列编码到这个地方?
mutate()
后面漏掉了一个%>%
。我已经编辑了我的答案,现在包括它了。 - dylanjm