假设我已经将一个简单的列数据框转换为numpy数组:
gdf.head()
>>>
rid rast
0 1 01000001000761C3ECF420013F0761C3ECF42001BF7172...
1 2 01000001000761C3ECF420013F0761C3ECF42001BF64BF...
2 3 01000001000761C3ECF420013F0761C3ECF42001BF560C...
3 4 01000001000761C3ECF420013F0761C3ECF42001BF7F25...
4 5 01000001000761C3ECF420013F0761C3ECF42001BF7172...
raster_np = gdf.to_numpy()
raster_np[0][0]
>>> array([1, '01000001000761C3E.........], dtype=object))
我的任务是将numpy数组转换为Zarr
文件格式(由于rast
值的大小和数据帧的大小,可能需要分块和压缩,我猜测新的.zarr文件可以更好地在S3 /云存储环境中利用)。我像这样创建了一个简单的Zarr
数组:
z_test = z.zeros(shape=(10000, 2), chunks=(10000, 2))
z_test
>>> <zarr.core.Array (10000, 2) float64>
现在,我该如何将raster_np
中的数据传输到z_test
并保留Zarr
属性?仅使用z_test = raster_np
显然行不通。也许我对Zarr
有所误解。 有什么建议吗?