17得票3回答
使用h5py保存pandas DataFrame以便与其他hdf5读取器进行互操作。

这是一个样本数据框:import pandas as pd NaN = float('nan') ID = [1, 2, 3, 4, 5, 6, 7] A = [NaN, NaN, NaN, 0.1, 0.1, 0.1, 0.1] B = [0.2, NaN, 0.2, 0.2, 0.2, ...

17得票5回答
Python粒子模拟器:离线处理

问题描述 在Python/Numpy中编写一个蒙特卡罗粒子模拟器(布朗运动和光子发射)。我需要将模拟输出(>>10GB)保存到文件中,并在第二步处理数据。与Windows和Linux的兼容性很重要。 粒子数 (n_particles) 在10-100之间。时间步数(time_size) 大...

17得票3回答
h5py能否从内存中的字节数组加载文件?

我的Python代码接收一个代表HDF5文件字节的字节数组。 我想读取这个字节数组到内存中的h5py文件对象而不是先将其写入磁盘。 此页面显示可以打开一个内存映射文件,但它将是一个新的空文件。我想要从字节数组到内存中的hdf5文件,使用它,丢弃它,并且在任何时候都不写入磁盘。 是否可以使用h5...

16得票1回答
使用h5py编写大型hdf5数据集

目前,我正在使用h5py生成hdf5数据集。我的情况类似于这样import h5py import numpy as np my_data=np.genfromtxt("/tmp/data.csv",delimiter=",",dtype=None,names=True) myFile="/...

15得票2回答
在Mac上安装h5py setup.py时出现问题:找不到hdf5.h文件

我正在Mac上构建h5py,按照这个链接中的“针对Parallel HDF5构建”的说明进行: http://docs.h5py.org/en/latest/build.html $ export CC=mpicc $ python setup.py configure --mpi $ su...

14得票1回答
更新h5py数据集

有没有人有更新h5py中hdf5数据集的想法?假设我们创建了一个数据集,例如:import h5py import numpy f = h5py.File('myfile.hdf5') dset = f.create_dataset('mydataset', data=numpy.ones((...

14得票2回答
如何使用`h5py`调整HDF5数组的大小

我该如何使用Python库h5py调整HDF5数组的大小? 我已经尝试使用.resize方法,针对一个启用chunks选项的数组进行操作,但仍然存在问题。In [1]: import h5py In [2]: f = h5py.File('foo.hdf5', 'w') In [3]: ...

13得票2回答
使用h5py数组保存不同大小的数据

我试图使用HDF5数据格式存储大约3000个numpy数组。这些数组的长度从5306到121999 np.float64不等。 由于数据的不规则性,numpy使用一般对象类,因此我遇到了“Object dtype dtype('O') has no native HDF5 equivalen...

13得票1回答
HDF5中用于Python/pandas快速读写的推荐压缩格式是什么?

我已经多次阅读到,在HDF5中启用压缩可以提高读写性能。我想知道在以下情况下,什么样的理想设置可以实现良好的读写性能: data_df.to_hdf(..., format='fixed', complib=..., complevel=..., chunksize=...) 我已经在使用fi...

13得票1回答
PyTables写入速度比h5py快,为什么?

我注意到使用h5py库写入.h5文件比使用pytables库要慢得多。这是为什么?即使数组的形状已知,情况也是如此。此外,我使用相同的块大小和无压缩过滤器。 以下是脚本:import h5py import tables import numpy as np from time import...