编程语言R:library方法'loess'中'weights'参数的含义

5
我使用R编程语言的库方法loess进行非参数数据拟合。数据集是二维的。我没有找到任何关于方法参数weights的合适文档。
我的数据点是正态分布的随机变量,我还估算出它们各自的标准偏差。我想知道参数weights是否允许我向R提供标准偏差的详细信息。换句话说:我想知道weights中的各个权重是否是(相对)衡量数据质量的措施,因此如果通过参数weights提供了某些数据不确定性的度量,则可以改善拟合。
编辑:我怀疑weights中的条目用作LOESS过程中局部数据集的加权最小二乘回归中的权重(也许作为(位置相关的)核函数的额外权重先决条件?)。这表明,对于独立正态分布的随机变量但仍具有不同噪声级别(如我的情况)的数据点,应将权重选择为1/\sigma_{i}^2,其中\sigma_{i}是相应随机变量/数据点的标准偏差。如果有人确定,请告知。

1
简而言之:是的。这就是您从权重中期望的内容。为了更好地理解,可以参考例如“weighted.mean”的相同论点。当然,您不希望将标准差用作权重。 - mts
@mts:感谢您提供有关weighted.mean的提示。直觉上,我会使用标准偏差的倒数作为权重。由于我不太了解R的loess实现的内部工作原理,所以我不确定这是否是一个合适的选择。 - sperber
3
如果你在谷歌上找不到关于权重的标准/好选择,不确定该选什么,可以去http://stats.stackexchange.com/ 上问,因为这已经不是一个编程问题了。如果你对loess在做什么感兴趣,考虑查看源代码。 - mts
1个回答

1
这个页面证实了我的怀疑:

https://docs.tibco.com/pub/enterprise-runtime-for-R/3.1.0/doc/html/Language_Reference/stats/loess.html

关于loess的参数weights,它表示:

一个可选的表达式,用于为局部拟合准则中形成的平方残差总和中的每个观测值赋予权重。默认情况下,进行无权重的拟合。如果提供了权重,则将其视为在与模型公式相同的数据框中求值的表达式。它应该评估为非负数值向量。如果不同的观测值具有不等方差,则权重应该与方差成反比


网页内容由stack overflow 提供, 点击上面的
可以查看英文原文,
原文链接