在箱线图中更改异常值规则

16

我在使用R语言绘制了一些箱线图,发现有几个异常值。默认情况下,设置异常值的限制标准是:

  • Q3 + 1.5*IQR
  • Q1 - 1.5* IQR

但我希望将异常值定义为落在以下边界之外的值:

  • Q3 + 3*IQR
  • Q1 - 3* IQR

请问在R中是否可以实现这样的设置?


1
这个最近的问题似乎也和这里相关:https://dev59.com/1W445IYBdhLWcg3wR4NN - Chase
2个回答

25

来自 ?boxplot

范围(range):这决定了箱线图的错误棒延伸多远。如果“范围”为正值,则误差棒延伸到最极端的数据点,该数据点距离中位数的距离不超过“范围”乘以四分位距。当值为零时,误差棒将延伸到数据极值。

因此设置 range=3


19

我鼓励您在深思熟虑之后再决定是否这样做——人们希望触须延伸1.5个四分位距。更改范围将违反这些假设,并使人们很容易从您的图形中得出错误的结论。


我认为Tukey箱线图在可视化异常值方面非常有用。然而,在某些情况下,使用“五点图”比较不同样本中数据的分布(从最小值到最大值),而不受异常值的干扰,也是很有用的。这应该在文本中加以解释。 - Marco Stamazza

网页内容由stack overflow 提供, 点击上面的
可以查看英文原文,
原文链接