根据距离汇总 SF 点数

Question

根据距离汇总 SF 点数

4

我想创建一个SpatialPointsDataFrame变量的平均值，当点在特定距离内时。我有一种方法可以做到这一点，但似乎是一种愚蠢的方式来解决这个问题。欢迎使用现代语法（如“整洁”的语法）的任何想法来实现此目标。

首先，我有一个SpatialPointsDataFrame，其中包含每个点测量的几个变量。我想获取所有点中指定距离内变量的平均值。例如，从"meuse"数据中获取距离彼此100米内的平均镉值：

library(sf)
library(sp)
data(meuse)
pts <- st_as_sf(meuse, coords = c("x", "y"),remove=FALSE)
pts100 <- st_is_within_distance(pts, dist = 100)
# can use sapply to get mean of a variable. E.g., cadmium
sapply(pts100, function(x){ mean(pts$cadmium[x]) })

那么，我已经明白了如何使用sapply逐个变量进行操作。因此，如果需要的话，我可以为每个变量计算平均值，为每个点生成一个质心，然后创建包含唯一值的SpatialPointsDataFrame。例如，对于前几个变量：

res <- data.frame(id=1:length(pts100),
                  x=NA, y=NA,
                  cadmium=NA, copper=NA, lead=NA)
res$x <- sapply(pts100, function(p){ mean(pts$x[p]) })
res$y <- sapply(pts100, function(p){ mean(pts$y[p]) })
res$cadmium <- sapply(pts100, function(p){ mean(pts$cadmium[p]) })
res$copper <- sapply(pts100, function(p){ mean(pts$copper[p]) })
res$lead <- sapply(pts100, function(p){ mean(pts$lead[p]) })
res2 <- res[duplicated(res$cadmium),]
coordinates(res2) <- c("x","y")
bubble(res2,"cadmium")

这种方法虽然可行，但似乎有些繁琐，而且可能存在更高效的方式。

- user111024

1个回答

网页内容由stack overflow 提供, 点击上面的

可以查看英文原文，
原文链接

- mrhellmann · Accepted Answer

看起来 sf 包有一个聚合函数，它有一个连接参数，您可以在其中指定连接类型。

ibrary(sf)
library(sp)
data(meuse)
pts <- st_as_sf(meuse, coords = c("x", "y"),remove=FALSE)

# This will give lots of warnings since there are non-numeric columns
pts_agg <- aggregate(pts,
                     pts,
                     FUN = mean, 
                     join = function(x, y) st_is_within_distance(x, y, dist = 100))

head(pts_agg)

Simple feature collection with 6 features and 14 fields
geometry type:  POINT
dimension:      XY
bbox:           xmin: 181025 ymin: 333260 xmax: 181390 ymax: 333611
CRS:            NA
         x        y cadmium copper lead   zinc  elev        dist   om ffreq soil lime landuse dist.m
1 181048.5 333584.5   10.15     83  288 1081.5 7.446 0.006791165 13.8    NA   NA   NA      NA     40
2 181048.5 333584.5   10.15     83  288 1081.5 7.446 0.006791165 13.8    NA   NA   NA      NA     40
3 181165.0 333537.0    6.50     68  199  640.0 7.800 0.103029000 13.0    NA   NA   NA      NA    150
4 181298.0 333484.0    2.60     81  116  257.0 7.655 0.190094000  8.0    NA   NA   NA      NA    270
5 181307.0 333330.0    2.80     48  117  269.0 7.480 0.277090000  8.7    NA   NA   NA      NA    380
6 181390.0 333260.0    3.00     61  137  281.0 7.791 0.364067000  7.8    NA   NA   NA      NA    470
               geometry
1 POINT (181072 333611)
2 POINT (181025 333558)
3 POINT (181165 333537)
4 POINT (181298 333484)
5 POINT (181307 333330)
6 POINT (181390 333260)

抽查第9行，因为在pts100中有几个匹配项：

> pts[pts100[[9]], 'cadmium'] %>% st_drop_geometry %>% summarise(mean = mean(cadmium))
  mean
1 2.25


> pts_agg[9,'cadmium']
Simple feature collection with 1 feature and 1 field
geometry type:  POINT
dimension:      XY
bbox:           xmin: 181060 ymin: 333231 xmax: 181060 ymax: 333231
CRS:            NA
  cadmium              geometry
9    2.25 POINT (181060 333231)