我有一个非常大的 data.table 对象(1M 行,220 列),我希望将所有空白('')替换为 NA。我在这个 帖子中找到了解决方案,但对于我的数据表来说速度极慢(已经超过 15 分钟)。 其他帖子中的示例:
data = data.frame(cats=rep(c('', ' ', 'meow'),1e6),
dogs=rep(c("woof", " ", NA),1e6))
system.time(x<-apply(data, 2, function(x) gsub("^$|^ $", NA, x)))
你是否有更快的方法使用data.table来实现这个需求?
实际上,提供的数据看起来并不像原始数据,这只是一个示例。下面是我真实数据的子集,会出现CharToDate(x)错误:
DT <- data.table(ID=c(10),DEFAULT_DATE=as.Date("2012-07-31"),value='')
system.time(DT[DT=='']<-NA)
rep(dogs=c("woof...
中的数据时出现了错误。 - jangorecki