plot.lm() 如何确定残差与拟合值图中的异常值?

8
plot.lm()如何确定哪些点是异常值(即要标记哪些点)以进行残差与拟合图?在文档中,我唯一发现的内容是:
“详情”: 默认情况下,子标题(即函数调用)会显示为每个图的副标题(在x轴标题下方),当图分别位于单独的页面上时,或者作为外边距中的副标题(如果有多个图在同一页上)。 “比例位置”图,也称为“扩展位置”或“S-L”图,通过取绝对残差的平方根来减小偏斜度(sqrt(|E|))明显比高斯零均值E的| E |更不偏斜)。 'S-L'、Q-Q和残差杠杆力量图使用标准化残差,这些残差在假设下具有相同的方差。它们被给定为R[i]/(s * sqrt(1-h.ii)),其中h.ii是帽子矩阵的对角线条目,影响()$ hat(请参见帽子),而残差杠杆力量图使用标准化Pearson残差(residuals.glm(type =“pearson”))用于R[i]。 残差杠杆力量图显示相等的Cook距离轮廓,对于cook.levels的值(默认为0.5和1),省略具有警告的杠杆率为1的情况。如果杠杆率是常数(通常在平衡aov情况下是这种情况),则该图使用因子级别组合而不是杠杆率用于x轴。(因子级别按均拟合值排序。) 在Cook的距离与杠杆/(1-杠杆)图中,相等大小的标准化残差轮廓线通过原点。轮廓线用大小标记。
但它没有说明如何生成残差与拟合图以及如何选择要标记哪些点。
更新:Zheyuan Li的答案表明,残差与拟合图标记点的方法实际上只是查看具有最大残差的3个点。这确实是事实。可以通过以下“极端”示例来证明。
x = c(1,2,3,4,5,6)
y = c(2,4,6,8,10,12)
foo = data.frame(x,y)
model = lm(y ~ x, data = foo)

enter image description here


@ZheyuanLi 谢谢。我在文档中看到了这个,但我想知道为什么我们没有像 id.n = ALL 这样的选项。现在我明白了。 - 3x89g2
2个回答

13

他们找出最大的3个绝对标准化残差。考虑这个例子:

fit <- lm(dist ~ speed, cars)
plot(fit, which = 1)

enter image description here

r <- rstandard(fit)  ## get standardised residuals
order(abs(r), decreasing = TRUE)[1:3]
# [1] 49 23 35

0

它是3个绝对最高的拟合值

r <- abs(selectedMod$residuals)
order((r), decreasing = TRUE)[1:3]

网页内容由stack overflow 提供, 点击上面的
可以查看英文原文,
原文链接