我想检查我的数据集-航班,并使用summary()
函数。
summary(flights["tailnum"])
结果:
tailnum
Length:336776
Class :character
Mode :character
特别地,它并没有表明字符变量 tailnum
中是否有任何缺失值。
然而,当我使用 sum(is.na(flights$tailnum))
时,它显示有缺失值。
[1] 2512
什么是检查分类变量的最佳函数 - 显示其级别、缺失值、总行数和每个级别的频率?
summary.default
的源代码(它被summary.data.frame
使用),它会特别查找数字数据中的NA
,而不会在其他类别中查找。这是不一致的。您是否考虑编写自己的函数,作为summary
的几乎副本,以便将其添加到输出中? - r2evansr-devel
上讨论)。我想其中一些原因是字符向量在统计分析中几乎从未被使用,除非首先(有时是隐式地)将它们转换为因子... - Ben Bolker