自动克里金法和手动克里金法的结果不同。

Question

自动克里金法和手动克里金法的结果不同。

4

有人能帮我理解为什么自动和手动克里金法得到的结果差异如此之大吗？我看到这两种算法使用了不同的变程模型，但这是否就是所有偏差的原因呢？我还不太确定的是，autokrige在没有数据的位置（例如网格的左下角和右下角）预测出的值明显比实际值高得多。这是否与将（对数转换的）克里金输出通过指数运算转换回来有关？此外，两种方法都预测出比数据低得多的值。似乎我在其中一个或两个算法中做错了什么，非常感谢任何帮助。

编辑：这里提供用于此处使用的数据的GitHub链接（我使用了此建议分享csv文件）。

library(sp)
library(gstat)
library(automap)

# get data
df <- read.csv("data.csv")
---------------------------
> head(df)
      long     lat n
1 -76.7116 39.2992 1
2 -76.7113 39.3553 1
3 -76.7113 39.3607 1
4 -76.7112 39.3126 2
5 -76.7110 39.2973 1
6 -76.7110 39.3364 1
---------------------------

# generate regular grid
coordinates(df) <- ~ long + lat
grd <- spsample(df, type = "regular", n = 10000)
colnames(grd@coords) <- c("long", "lat")        # rename coords as in data
gridded(grd) <- TRUE

# manual kriging
form <- as.formula("log(n) ~ long + lat")       # universal kriging formula
v <- variogram(object = form, locations = df)
vmfit <- fit.variogram(v,
                     model = vgm(model = c("Sph", "Exp", "Mat", "Gau", "Ste")))
-----------------------------------
> vmfit
  model     psill       range kappa
1   Ste 0.2886451 0.001786237   0.5
-----------------------------------
krg <- krige(formula = form, locations = df, newdata = grd, model = vmfit)
krg_df <- data.frame(krg@coords,                # extract kriged data
                     pred = exp(krg@data$var1.pred))

# auto kriging
krg2 <- autoKrige(formula = form, input_data = df, new_data = grd)
krg2_df <- data.frame(krg2$krige_output@coords,
                      pred = exp(krg2$krige_output@data$var1.pred))
-----------------------------------
> krg2$var_model
  model      psill      range
1   Nug 0.26473893 0.00000000
2   Sph 0.02574092 0.01657061
-----------------------------------

- Manojit

2个回答

1

罗伯特上面的回答给了我一个想法，尝试使用公式n ~ long + lat（而不是我之前使用的log(n) ~ long + lat）。现在这两种方法似乎表现一致，但有合理的差异。我想知道这是否是因为我的数据倾斜，其中70％的数据n = 1。在早期的公式中使用log(n)只留下30％的非零值，导致一个稀疏的领域，几乎没有空间相关性可供krige使用。

上面的例子中的meuse数据没有这个问题：log(zinc) > 0适用于所有zinc值。

- Manojit

网页内容由stack overflow 提供, 点击上面的

可以查看英文原文，
原文链接

- Robert Hijmans · Accepted Answer

我认为问题出在公式上。正确的公式应该是 n ~ 1。

示例数据：

library(gstat)
library(automap)
data(meuse)
coordinates(meuse) =~ x+y
data(meuse.grid)
gridded(meuse.grid) =~ x+y

解决方案：

form <- zinc ~ 1

# manual
v <- variogram(form, meuse)
m <- fit.variogram(v, model=vgm(model=c("Sph", "Exp", "Mat", "Gau", "Ste")))
km <- krige(form, meuse, meuse.grid, model = m)

# auto
ka <- autoKrige(form, meuse, meuse.grid)

请看：

g <- cbind(km[,1], ka[[1]][,1])
names(g) <- c("manual", "auto")
spplot(g)