我们从CSV文件中得到了一个数据框。数据框
DF
中包含了包含观测值的列,还有一列 (VaR2
) 包含了测量被采取的日期。如果日期没有被记录,CSV文件中会包含缺失数据的值 NA
。Var1 Var2
10 2010/01/01
20 NA
30 2010/03/01
我们希望使用subset命令来定义一个新的数据框new_DF,使其仅包含具有某一列(VaR2)中“NA”值的行。在给定的示例中,只有第二行将包含在新的DF中。
该命令为:new_DF<-subset(DF, DF$Var2=="NA")
代码不起作用,生成的数据框没有任何行。
如果在原始CSV文件中使用NULL
替换值NA
,则相同的命令会产生所需的结果:
new_DF <- subset(DF, DF$Var2=="NULL")
如果在原始CSV文件中提供了字符字符串的值NA
,我该如何使此方法工作?
new_DF <- DF[is.na(DF$Var),]
,也就是说,在DF[
后面多了一个括号。 - PatrickT