我有一个数据框,其中有一个名为“State”的列,它是一个包含美国州名的因子。并非所有州都在值中出现,但所有州都在因子水平中出现。
如何找到数据框中从未使用过的因子水平?
如何找到数据框中从未使用过的因子水平?
尝试:
# A toy factor variable:
f <- factor(letters[1:2], levels = letters[1:4])
f
[1] a b
Levels: a b c d
levels(f)
[1] "a" "b" "c" "d"
查看未使用的关卡:
setdiff(levels(f), f)
[1] "c" "d"
setdiff(levels(f), unique(f))
可能会更有效率吗? - Danny