这次我不会直接问如何检测异常值,就像之前我在一个问题中提到的那样。我读了一些与这个主题相关的帖子,但没有得到我需要的东西。我有一组给定的值,如下所示:
现在,大多数研究人员都认为异常值检测过程不仅取决于数据本身,还取决于上下文。我使用了R中的几个包,如outliers(grubbs测试),extremevalues,mvoutlier(pcout方法),但无法找到最佳使用方法。在这种情况下(根据我的要求),7.77(obs no 31),7.92(obs on 20)和3.50(obs no 6)是异常值。使用outliers包的grubbs测试,我可以将7.77和7.92检测为异常值,但不能检测3.50。我不知道是否可以在此处发布我的数据图,但在查看数据趋势或分布后,观察编号6显然是一个离群值。
我正在尝试将非线性模型拟合到这些数据中,但由于这些异常值,我无法找到最佳拟合(最佳拟合不是唯一的要求),无论如何,我需要检测这些异常值,因为我将在这些异常值上拟合单独的模型。
我的问题很简单。是否有可能使用某些标准包来检测这3个离群值,或者如何使用我的非线性生成模型来帮助检测这些离群值?
此致
Shahzad
y<-c(0.59, 0.61, 0.59, 1.55, 1.33, 3.50, 1.00, 1.22, 2.50, 3.00, 3.79, 3.98, 4.33, 4.45, 4.59, 4.72, 4.82, 4.90, 4.96, 7.92, 5.01, 5.01, 4.94, 5.05, 5.04, 5.03, 5.06, 5.10, 5.04, 5.06, 7.77, 5.07, 5.08, 5.08, 5.12, 5.12, 5.08, 5.17, 5.18)
现在,大多数研究人员都认为异常值检测过程不仅取决于数据本身,还取决于上下文。我使用了R中的几个包,如outliers(grubbs测试),extremevalues,mvoutlier(pcout方法),但无法找到最佳使用方法。在这种情况下(根据我的要求),7.77(obs no 31),7.92(obs on 20)和3.50(obs no 6)是异常值。使用outliers包的grubbs测试,我可以将7.77和7.92检测为异常值,但不能检测3.50。我不知道是否可以在此处发布我的数据图,但在查看数据趋势或分布后,观察编号6显然是一个离群值。
我正在尝试将非线性模型拟合到这些数据中,但由于这些异常值,我无法找到最佳拟合(最佳拟合不是唯一的要求),无论如何,我需要检测这些异常值,因为我将在这些异常值上拟合单独的模型。
我的问题很简单。是否有可能使用某些标准包来检测这3个离群值,或者如何使用我的非线性生成模型来帮助检测这些离群值?
此致
Shahzad