将多个 POLYGON 聚合成 MULTIPOLYGON 并保留 data.frame 数据结构。

9
我有一个 POLYGON 几何类型的 sf 对象。我想使用分组属性(group_attr)将这些多边形聚合成 MULTIPOLYGONs,并将一个新的 MULTIPOLYGON 对象与属性表连接起来。因此,结果将是一个具有两行三列(group_attr、second_attr、geometry)的 sf 对象。我已经尝试过使用 st_cast,在 sfc 对象上效果很好,但在 sf 对象上不行。是否可以使用 sf 包来实现这一点?
p1 <- rbind(c(0,0), c(1,0), c(3,2), c(2,4), c(1,4), c(0,0))
pol1 <-st_polygon(list(p1))
p2 <- rbind(c(3,0), c(4,0), c(4,1), c(3,1), c(3,0))
pol2 <-st_polygon(list(p2))
p3 <- rbind(c(4,0), c(4,1), c(5,1), c(5,0),c(4,0))
pol3 <-st_polygon(list(p3))
p4 <- rbind(c(3,3), c(4,2), c(4,3), c(3,3))
pol4 <-st_polygon(list(p4))

d <- data.frame(group_attr = c(1, 1, 2, 2), 
                second_attr = c('forest', 'forest', 'lake', 'lake'))
d$geometry <- st_sfc(pol1, pol2, pol3, pol4)
df<- st_as_sf(d)
plot(df)
df

Simple feature collection with 4 features and 2 fields
geometry type:  POLYGON
dimension:      XY
bbox:           xmin: 0 ymin: 0 xmax: 5 ymax: 4
epsg (SRID):    NA
proj4string:    NA
  group_attr second_attr                       geometry
1          1      forest POLYGON((0 0, 1 0, 3 2, 2 4...
2          1      forest POLYGON((3 0, 4 0, 4 1, 3 1...
3          2        lake POLYGON((4 0, 4 1, 5 1, 5 0...
4          2        lake  POLYGON((3 3, 4 2, 4 3, 3 3))

enter image description here

3个回答

5

一种基于https://github.com/r-spatial/sf/issues/634#issuecomment-365151794的新方法:

library(dplyr)

df_new <- df %>%
  group_by(group_attr) %>%
  summarise_all(first) 
df_new

Simple feature collection with 2 features and 2 fields
geometry type:  MULTIPOLYGON
dimension:      XY
bbox:           xmin: 0 ymin: 0 xmax: 5 ymax: 4
epsg (SRID):    NA
proj4string:    NA
# A tibble: 2 x 3
  group_attr second_attr                                                        geometry
       <dbl> <fct>                                                        <MULTIPOLYGON>
1       1.00 forest      (((3 0, 3 1, 4 1, 4 0, 3 0)), ((0 0, 1 4, 2 4, 3 2, 1 0, 0 0)))
2       2.00 lake                  (((4 0, 4 1, 5 1, 5 0, 4 0)), ((3 3, 4 2, 4 3, 3 3)))

2
这对我非常有效。拥有“first”函数进行汇总有什么作用? - canderson156
我不确定为什么他们在这里使用它,但是 dplyr::first 是一个快捷方式,用于定位向量中的第一个项目,相当于 [[1]]。这将作为 .funs 参数传递给 summarise_all,也许他们使用它来控制列名。进一步调查会很有趣。 - Francis Barton

3

或者:

> aggregate(df, list(df$second_attr), function(x) x[1])
Simple feature collection with 2 features and 3 fields
Attribute-geometry relationship: 0 constant, 2 aggregate, 1 identity
geometry type:  MULTIPOLYGON
dimension:      XY
bbox:           xmin: 0 ymin: 0 xmax: 5 ymax: 4
epsg (SRID):    NA
proj4string:    NA
  Group.1 group_attr second_attr                       geometry
1  forest          1      forest MULTIPOLYGON(((3 0, 3 1, 4 ...
2    lake          2        lake MULTIPOLYGON(((4 0, 4 1, 5 ...

谢谢 - 这个方法很干净。我要注意一下,我不得不对这个方法进行轻微的变化 emp <- st_is_empty(df); aggregate(df[!emp,], by=list(df$second_attr[!emp]), FUN=function(x) x[1]) 因为我有一些空多边形。经过长时间的思考,我发现我需要先排除它们。 - thelatemail
如果您认为这是一个问题,请在sf github页面上提出它。 - Edzer Pebesma

1

非常hacky(或者幼稚)的方法:

attr_table <- df %>% 
        as_data_frame() %>% 
        select(-geometry) %>% 
        unique()

new_df <- df %>% 
        group_by(group_attr) %>% 
        summarise() %>% 
        as.data.frame(.) %>% 
        left_join(., attr_table, by='group_attr')   %>% 
        st_as_sf()

new_df

Simple feature collection with 2 features and 2 fields
geometry type:  MULTIPOLYGON
dimension:      XY
bbox:           xmin: 0 ymin: 0 xmax: 5 ymax: 4
epsg (SRID):    NA
proj4string:    NA
  group_attr second_attr                       geometry
1          1      forest MULTIPOLYGON(((3 0, 3 1, 4 ...
2          2        lake MULTIPOLYGON(((4 0, 4 1, 5 ...

网页内容由stack overflow 提供, 点击上面的
可以查看英文原文,
原文链接