如何查找未使用的因子水平?

6
我有一个数据框,其中有一个名为“State”的列,它是一个包含美国州名的因子。并非所有州都在值中出现,但所有州都在因子水平中出现。
如何找到数据框中从未使用过的因子水平?

如果您查看因子变量,所有水平都将被打印。 - DatamineR
如何在程序中使用这个事实? - Suzan Cioc
1个回答

12

尝试:

# A toy factor variable:
f <- factor(letters[1:2], levels = letters[1:4])
f
[1] a b
Levels: a b c d
levels(f)
[1] "a" "b" "c" "d"

查看未使用的关卡:

setdiff(levels(f), f)
[1] "c" "d"

这很不错。对于长向量来说,使用setdiff(levels(f), unique(f))可能会更有效率吗? - Danny

网页内容由stack overflow 提供, 点击上面的
可以查看英文原文,
原文链接