如何根据另一个向量的值对一个向量进行排序

Question

如何根据另一个向量的值对一个向量进行排序

131

我有一个向量x，我希望将其按照向量y中数值的顺序进行排序。这两个向量的长度不相同。

x <- c(2, 2, 3, 4, 1, 4, 4, 3, 3)
y <- c(4, 2, 1, 3)

预期结果应为：

[1] 4 4 4 2 2 1 3 3 3

- learnr

7个回答

6

您可以将 x 转换为有序因子：

x.factor <- factor(x, levels = y, ordered=TRUE)
sort(x)
sort(x.factor)

显然，将数字转换为因子可以从根本上改变下游代码对x作出反应的方式。但是由于您没有告诉我们接下来会发生什么，所以我想建议这个选项。

- Matt Parker

1

这应该是最好的答案，因为它适用于非整数情况；或者在 x 中有值不在排序向量 y 中时也能工作，只需稍作修改：x <- c(2, 2, 3, 4, 1, 4, 4, 3, 3, 6); y <- c(4, 2, 1, 3); as.numeric(as.character(sort(factor(x, unique(c(y, x)))))) - rawr

2

怎么样？

rep(y,table(x)[as.character(y)])

（Ian的可能仍然更好）

- Ben Bolker

2

如果您需要按“y”排序，无论是数字还是字符：

x[order(ordered(x, levels = y))]
4 4 4 2 2 1 3 3 3

步骤如下:

a <- ordered(x, levels = y) # Create ordered factor from "x" upon order in "y".
[1] 2 2 3 4 1 4 4 3 3
Levels: 4 < 2 < 1 < 3

b <- order(a) # Define "x" order that match to order in "y".
[1] 4 6 7 1 2 5 3 8 9

x[b] # Reorder "x" according to order in "y".
[1] 4 4 4 2 2 1 3 3 3

- George Shimanovsky

1

[编辑： Ian 明显有正确的方法，但我将保留这个回答。]

您可以通过对y向量进行索引而不使用循环来完成此操作。将递增的数字值添加到y中并合并它们：

y <- data.frame(index=1:length(y), x=y)
x <- data.frame(x=x)
x <- merge(x,y)
x <- x[order(x$index),"x"]
x
[1] 4 4 4 2 2 1 3 3 3

- Shane

0

x <- c(2, 2, 3, 4, 1, 4, 4, 3, 3)
y <- c(4, 2, 1, 3)
for(i in y) { z <- c(z, rep(i, sum(x==i))) }

z的结果：4 4 4 2 2 1 3 3 3

重要步骤：

for(i in y) -- 循环遍历感兴趣的元素。
z <- c(z, ...) -- 依次连接每个子表达式。
rep(i, sum(x==i)) -- 重复i（当前感兴趣的元素）sum(x==i)次（我们在x中找到i的次数）。

- Godeke

0

你也可以使用 sqldf 并通过 sql 中的 join 函数来执行以下操作：

library(sqldf)
x <- data.frame(x = c(2, 2, 3, 4, 1, 4, 4, 3, 3))
y <- data.frame(y = c(4, 2, 1, 3))

result <- sqldf("SELECT x.x FROM y JOIN x on y.y = x.x")
ordered_x <- result[[1]]

- OmG

网页内容由stack overflow 提供, 点击上面的

可以查看英文原文，
原文链接

- George Dontas · Accepted Answer

222

这个怎么样？

x[order(match(x,y))]

- George Dontas

32

这很棒，我认为比被接受的答案更通用。 - fmark

2

我认为这应该成为基本的GNU-R功能。 - catastrophic-failure

当我在使用字符向量 x 和 y 时，这个答案对我很有效。像被接受的答案那样添加分解/略加说明会更好。 - mavericks