8得票2回答
为大型HDF5文件中的组内所有数据集重命名存在问题

我正在尝试重命名 HDF5 数据集时遇到了问题,但这个过程非常缓慢。我读过一些文档,得知数据集名称只不过是数据的链接,因此可以采用以下方法进行重命名: group['new_name'] = group['old_name'] del group['old_name'] 但是这个过程非常...

30得票3回答
使用Python将字符串列表存储到HDF5数据集

我想把一个可变长度的字符串列表存储到HDF5数据集中。代码如下:import h5py h5File=h5py.File('xxx.h5','w') strList=['asas','asas','asas'] h5File.create_dataset('xxx',(len(strLis...

9得票2回答
将HDF5文件转换为其他格式

我有一些HDF5文件的大数据集,希望用一种高效的方式将这些文件中的数据转换成XML、TXT或其他易于阅读的格式。我尝试使用Python包(www.h5py.org),但未能找到任何快速完成任务的方法。我没有限制使用Python,也可以使用Java、Scala或Matlab编码。请问有人可以给我...

7得票1回答
如何解决在导入h5py时出现的"ImportError: libhdf5_serial.so.103: cannot open shared object file: No such file or directory"错误。

我对Linux平台和树莓派都比较新,目前在使用Tensorflow进行机器学习项目。为了保存模型,我使用了h5py库。尽管我在安装该库时没有出现任何问题,但是在Python 3.7中导入它时却遇到了一个很大的Import Error。 我使用以下命令下载了h5py: pip3 install...

46得票2回答
在Python中使用h5py处理大数据的分析工作经验?

我从事大量的统计工作,并使用Python作为主要语言。然而,我处理的一些数据集可能需要20GB的内存,这使得使用numpy、scipy和PyIMSL等内存函数来操作它们几乎是不可能的。统计分析语言SAS在这里有一个很大的优势,它可以处理硬盘中的数据,而不是严格的内存处理。但是,我想避免在SAS...

10得票3回答
在 Mac M1 上构建 h5py 失败。

我试图在Python虚拟环境中安装AlphaFold。在安装依赖项时,我遇到了以下错误: ERROR: Could not find a version that satisfies the requirement tensorflow==1.14 (from versions: n...

7得票3回答
如何使用h5py读取仅包含数据集(无组)的HDF5文件?

我有一些HDF5文件,想要使用Python 2.7中的h5py模块打开。 如果我有一个包含组和数据集的文件,这很容易: import h5py as hdf with hdf.File(relative_path_to_file, 'r') as f: my_data = f['...

8得票1回答
HDF5存在数据损坏或丢失的可能性吗?

在维基百科上,我们可以阅读到有关HDF5的以下批评: “HDF5的批评源于其庞大的设计和冗长的规范。虽然是一个150页的开放标准,但只有一个C实现的HDF5,这意味着所有绑定都共享它的缺陷和性能问题。加上缺乏日志记录,当前稳定版本中已记录的错误可以破坏整个HDF5数据库。尽管1.10-alp...

7得票1回答
使用h5py将光栅图像添加到HDF5文件

如果我问的问题比较基础,我很抱歉,因为我对Python和HDF5都比较新。我正在使用h5py、numpy和Python 2.7。我有来自各种文件的数据需要导入到一个HDF5文件中。每个文件的数据都要存储在不同的组中。每个组都需要包含1)来自文件的原始数据作为m x n矩阵和2)从归一化的原始数...

9得票3回答
使用Python库h5py获取H5文件中所有键及其层次结构

我能否使用Python库h5py以递归方式获取h5文件中的所有键? 我尝试使用以下代码: import h5py h5_data = h5py.File(h5_file_location, 'r') print(h5_data.keys()) 但它仅打印出H5文件的顶级键。