我想根据另一列中的4个值创建一个新列。
if col1=1 then col2= G;
if col1=2 then col2=H;
if col1=3 then col2=J;
if col1=4 then col2=K.
我如何在 R 中实现这个功能? 请大家帮忙解决一下。我已经尝试使用 if/else 和 ifelse 了,但似乎都不起作用。谢谢。
我想根据另一列中的4个值创建一个新列。
if col1=1 then col2= G;
if col1=2 then col2=H;
if col1=3 then col2=J;
if col1=4 then col2=K.
我如何在 R 中实现这个功能? 请大家帮忙解决一下。我已经尝试使用 if/else 和 ifelse 了,但似乎都不起作用。谢谢。
您可以使用嵌套的ifelse
:
col2 <- ifelse(col1==1, "G",
ifelse(col1==2, "H",
ifelse(col1==3, "J",
ifelse(col1==4, "K",
NA )))) # all other values map to NA
在这个简单的例子中,使用它有点过头了,但对于更复杂的情况...
ifelse
会是一个更好的选择吗?这对我来说并不直观。 - Nate Anderson您有一个特殊情况,需要查找索引为整数1:4的值。这意味着您可以使用向量索引一步解决您的问题。
首先,创建一些示例数据:
set.seed(1)
dat <- data.frame(col1 = sample(1:4, 10, replace = TRUE))
接下来,定义查询值,并使用[
子集运算符查找所需结果:
values <- c("G", "H", "J", "K")
dat$col2 <- values[dat$col1]
结果:
dat
col1 col2
1 2 H
2 2 H
3 3 J
4 4 K
5 1 G
6 4 K
7 4 K
8 3 J
9 3 J
10 1 G
更普遍地,您可以使用与match
相结合的[
子集来解决这种问题:index <- c(1, 2, 3, 4)
values <- c("G", "H", "J", "K")
dat$col2 <- values[match(dat$col1, index)]
dat
col1 col2
1 2 H
2 2 H
3 3 J
4 4 K
5 1 G
6 4 K
7 4 K
8 3 J
9 3 J
10 1 G
set.seed(357)
mydf <- data.frame(col1 = sample(1:4, 10, replace = TRUE))
mydf$col2 <- rep(NA, nrow(mydf))
mydf[mydf$col1 == 1, ][, "col2"] <- "A"
mydf[mydf$col1 == 2, ][, "col2"] <- "B"
mydf[mydf$col1 == 3, ][, "col2"] <- "C"
mydf[mydf$col1 == 4, ][, "col2"] <- "D"
col1 col2
1 1 A
2 1 A
3 2 B
4 1 A
5 3 C
6 2 B
7 4 D
8 3 C
9 4 D
10 4 D
这是使用 car
的 recode
的其中一种方法。
library(car)
mydf$col3 <- recode(mydf$col1, "1" = 'A', "2" = 'B', "3" = 'C', "4" = 'D')
来自这个问题的另一个例子:
mydf$col4 <- c("A", "B", "C", "D")[mydf$col1]
?symnum
。col2<-symnum(col1, seq(0.5, 4.5, by=1), symbols=c("G", "H", "J", "K"))
这应该能让你接近。
data.frame
中添加列?,Excel 表格中的数据清理(该问题中还有一组链接)。 - Marek