如何在R中用NA替换0或缺失值

9

这是我目前为止已经完成的工作

data是数值数据类型

if (is.na(data) || attribute==0){replace(data,NA)}

我收到了错误信息,内容如下:

替换(attribute, NA)中的错误:缺少参数“values”,且没有默认值


你正在错误地使用 replace。请参阅 help(replace) - Rich Scriven
3个回答

11

使用mutate_all

library(dplyr)

df %>%
  mutate_all(~replace(., . == 0, NA))

或者使用 mutate_if 来保证安全:

df %>%
  mutate_if(is.numeric, ~replace(., . == 0, NA))

请注意,无需检查NA,因为我们无论如何都将替换为NA

输出:

> df %>%
+   mutate_all(~replace(., . == 0, NA))
    X  Y    Z
1   1  5 <NA>
2   4  4    2
3   2  3    2
4   5  5    2
5   5  3 <NA>
6  NA  4 <NA>
7   3  3    1
8   5  3    2
9   3  1    1
10  2 NA    5
11  5  5 <NA>
12  2  5    2
13  4  4    4
14  3  4 <NA>
15 NA NA    3
16  5  2    1
17  1  4 <NA>
18 NA  1    4
19  1  1    5
20  5  1    2

> df %>%
+   mutate_if(is.numeric, ~replace(., . == 0, NA))
    X  Y Z
1   1  5 0
2   4  4 2
3   2  3 2
4   5  5 2
5   5  3 0
6  NA  4 0
7   3  3 1
8   5  3 2
9   3  1 1
10  2 NA 5
11  5  5 0
12  2  5 2
13  4  4 4
14  3  4 0
15 NA NA 3
16  5  2 1
17  1  4 0
18 NA  1 4
19  1  1 5
20  5  1 2

数据:

set.seed(123)
df <- data.frame(X = sample(0:5, 20, replace = TRUE),
                 Y = sample(0:5, 20, replace = TRUE),
                 Z = as.character(sample(0:5, 20, replace = TRUE)))

请问您能告诉我如何导入您提到的库吗?因为它不允许我使用mutate_all函数。我正在R_markdown上进行测试。 - jdfhf
@jdfhf 执行 install.packages('dplyr') 然后执行 library(dplyr) 即可获取最新版本。你当前使用的 dplyr 版本可能已经过时了。 - acylam

6

你可以直接使用replace函数/包,无需任何额外的功能/包:

data <- replace(data, data == 0, NA)

现在假设data是您的数据框。

否则,您可以简单地插入列名,例如如果您的数据框是df,并且列名为data

df$data <- replace(df$data, df$data == 0, NA)

这是基于r的最佳解决方案。如果有人想使用dplyr解决方案,那么最简单的方法是 df %>% map_df(~ na_if(.x, 0)) - Agile Bean

2
假设 data 是一个数据框架(dataframe),您可以使用 sapply 根据一组过滤器来更新值: "最初的回答"
new.data = as.data.frame(sapply(data,FUN= function(x) replace(x,is.na(x) | x == 0)))

网页内容由stack overflow 提供, 点击上面的
可以查看英文原文,
原文链接