您好,我正在尝试将一组X和Y坐标转换为线。我想通过groupby
ID和时间映射此数据。只要我在一个列上groupby
,我的代码就会成功执行,但是当我在两个列上使用groupby
时,就会遇到错误。我参考了这个问题。
以下是一些示例数据:
ID X Y Hour
1 -87.78976 41.97658 16
1 -87.66991 41.92355 16
1 -87.59887 41.708447 17
2 -87.73956 41.876827 16
2 -87.68161 41.79886 16
2 -87.5999 41.7083 16
3 -87.59918 41.708485 17
3 -87.59857 41.708393 17
3 -87.64391 41.675133 17
这是我的代码:
df = pd.read_csv("snow_gps.csv", sep=';')
#zip the coordinates into a point object and convert to a GeoData Frame
geometry = [Point(xy) for xy in zip(df.X, df.Y)]
geo_df = GeoDataFrame(df, geometry=geometry)
# aggregate these points with the GrouBy
geo_df = geo_df.groupby(['track_seg_point_id', 'Hour'])['geometry'].apply(lambda x: LineString(x.tolist()))
geo_df = GeoDataFrame(geo_df, geometry='geometry')
这是错误信息: ValueError: LineStrings 必须至少有两个坐标元组。
这是我正在尝试获取的最终结果:
ID Hour geometry
1 16 LINESTRING (-87.78976 41.97658, -87.66991 41.9...
1 17 LINESTRING (-87.78964000000001 41.976634999999...
1 18 LINESTRING (-87.78958 41.97663499999999, -87.6...
2 16 LINESTRING (-87.78958 41.976612, -87.669785 41...
2 17 LINESTRING (-87.78958 41.976624, -87.66978 41....
3 16 LINESTRING (-87.78958 41.97666, -87.6695199999...
3 17 LINESTRING (-87.78954 41.976665, -87.66927 41....
请提供有关如何按多个参数进行分组的任何建议或想法。
df
并运行grouped = df.groupby(['ID', 'Hour']) grouped.groups
,则结果如下:{(0, 16): Int64Index([5, 14, 16, 55, 130], dtype='int64'), (0, 17): Int64Index([7, 27, 126, 141, 185, 235], dtype='int64'),...
但现在我没有坐标,并且不知道如何将点转换为线?也许我可以索引每个位置以获取它们的 xy 然后进行转换? - mm_nieder(df.groupby(['ID', 'Hour']).size() < 2).sum()
是否确实返回了0? - joris