我有一个巨大的xlsx文件,里面有很多空白单元格,我将其保存为csv格式时所有的空白都保留了下来。
当我导入csv文件后,数据集中出现了很多空字符串/空白单元格,其中一个列是“boat”。
我可以使用readxl包的函数(如read_xls或read_xlsx)直接将空字符串替换为NA,但我想知道是否有一种方法可以在将数据加载到R数据框之后再替换空字符串。
我尝试了以下方法,但它抛出了错误,我并不完全理解。我可以在下面的代码中指定NA为“NA”,然后它就会被替换为NA,但那将是字符串(NA),而不是缺失值NA,两者是不同的。
当我导入csv文件后,数据集中出现了很多空字符串/空白单元格,其中一个列是“boat”。
我可以使用readxl包的函数(如read_xls或read_xlsx)直接将空字符串替换为NA,但我想知道是否有一种方法可以在将数据加载到R数据框之后再替换空字符串。
我尝试了以下方法,但它抛出了错误,我并不完全理解。我可以在下面的代码中指定NA为“NA”,然后它就会被替换为NA,但那将是字符串(NA),而不是缺失值NA,两者是不同的。
titanic %>% mutate(boat = if_else(boat=="", NA ,boat))
Error in mutate_impl(.data, dots) :
Evaluation error: `false` must be type logical, not character.
?NA
。 - akrun