plot.lm()如何确定哪些点是异常值(即要标记哪些点)以进行残差与拟合图?在文档中,我唯一发现的内容是:
“详情”: 默认情况下,子标题(即函数调用)会显示为每个图的副标题(在x轴标题下方),当图分别位于单独的页面上时,或者作为外边距中的副标题(如果有多个图在同一页上)。 “比例位置”图,也称为“扩展位置”或“S-L”图,通过取绝对残差的平方根来减小偏斜度(sqrt(|E|))明显比高斯零均值E的| E |更不偏斜)。 'S-L'、Q-Q和残差杠杆力量图使用标准化残差,这些残差在假设下具有相同的方差。它们被给定为R[i]/(s * sqrt(1-h.ii)),其中h.ii是帽子矩阵的对角线条目,影响()$ hat(请参见帽子),而残差杠杆力量图使用标准化Pearson残差(residuals.glm(type =“pearson”))用于R[i]。 残差杠杆力量图显示相等的Cook距离轮廓,对于cook.levels的值(默认为0.5和1),省略具有警告的杠杆率为1的情况。如果杠杆率是常数(通常在平衡aov情况下是这种情况),则该图使用因子级别组合而不是杠杆率用于x轴。(因子级别按均拟合值排序。) 在Cook的距离与杠杆/(1-杠杆)图中,相等大小的标准化残差轮廓线通过原点。轮廓线用大小标记。
但它没有说明如何生成残差与拟合图以及如何选择要标记哪些点。
更新:Zheyuan Li的答案表明,残差与拟合图标记点的方法实际上只是查看具有最大残差的3个点。这确实是事实。可以通过以下“极端”示例来证明。
“详情”: 默认情况下,子标题(即函数调用)会显示为每个图的副标题(在x轴标题下方),当图分别位于单独的页面上时,或者作为外边距中的副标题(如果有多个图在同一页上)。 “比例位置”图,也称为“扩展位置”或“S-L”图,通过取绝对残差的平方根来减小偏斜度(sqrt(|E|))明显比高斯零均值E的| E |更不偏斜)。 'S-L'、Q-Q和残差杠杆力量图使用标准化残差,这些残差在假设下具有相同的方差。它们被给定为R[i]/(s * sqrt(1-h.ii)),其中h.ii是帽子矩阵的对角线条目,影响()$ hat(请参见帽子),而残差杠杆力量图使用标准化Pearson残差(residuals.glm(type =“pearson”))用于R[i]。 残差杠杆力量图显示相等的Cook距离轮廓,对于cook.levels的值(默认为0.5和1),省略具有警告的杠杆率为1的情况。如果杠杆率是常数(通常在平衡aov情况下是这种情况),则该图使用因子级别组合而不是杠杆率用于x轴。(因子级别按均拟合值排序。) 在Cook的距离与杠杆/(1-杠杆)图中,相等大小的标准化残差轮廓线通过原点。轮廓线用大小标记。
但它没有说明如何生成残差与拟合图以及如何选择要标记哪些点。
更新:Zheyuan Li的答案表明,残差与拟合图标记点的方法实际上只是查看具有最大残差的3个点。这确实是事实。可以通过以下“极端”示例来证明。
x = c(1,2,3,4,5,6)
y = c(2,4,6,8,10,12)
foo = data.frame(x,y)
model = lm(y ~ x, data = foo)
id.n = ALL
这样的选项。现在我明白了。 - 3x89g2