我有一个数据框,其中有一个分组因子(第一列)具有多个级别(超过两个),以及几列数据。我想将 wilcox.test 应用于整个数据框,以比较每个组变量之间的差异。我该怎么办?
更新: 我知道 wilcox.test 只能测试两个组之间的差异,而我的数据框包含三个组。但我更关心的是如何做到这一点,而不是使用哪种测试方法。很可能会删除一个组,但我还没有决定,因此我想测试所有变体。
以下是示例:
structure(list(group = c(1L, 1L, 1L, 1L, 1L, 1L, 2L, 2L, 2L,
2L, 2L, 2L, 2L, 3L, 3L, 3L, 3L, 3L, 3L, 3L, 3L), var1 = c(9.3,
9.05, 7.78, 7.11, 7.14, 8.12, 7.5, 7.84, 7.8, 7.52, 8.84, 6.98,
6.1, 6.89, 6.5, 7.5, 7.8, 5.5, 6.61, 7.65, 7.68), var2 = c(11L,
11L, 10L, 1L, 3L, 7L, 11L, 11L, 11L, 11L, 4L, 1L, 1L, 1L, 2L,
2L, 1L, 4L, 8L, 8L, 1L), var3 = c(7L, 11L, 3L, 7L, 11L, 2L, 11L,
5L, 11L, 11L, 5L, 11L, 11L, 2L, 9L, 9L, 3L, 8L, 11L, 11L, 2L),
var4 = c(11L, 11L, 11L, 11L, 6L, 11L, 11L, 11L, 10L, 7L,
11L, 2L, 11L, 3L, 11L, 11L, 6L, 11L, 1L, 11L, 11L), var5 = c(11L,
1L, 2L, 2L, 11L, 11L, 1L, 10L, 2L, 11L, 1L, 3L, 11L, 11L,
8L, 8L, 11L, 11L, 11L, 2L, 9L)), .Names = c("group", "var1",
"var2", "var3", "var4", "var5"), class = "data.frame", row.names = c(NA,
-21L))
更新
感谢大家提供的所有答案!
wilcox.test
只能测试两组之间的差异。而你的数据框包含了三组。你确定这是你想要的测试吗?如果是,你是否需要进行所有可能的成对比较? - RoyalTS