Python的HDF5:高级接口与低级接口。h5py

7
我一直在使用C和Matlab处理HDF5文件,两者都使用相同的方式读写数据集:

  • 使用h5f打开文件
  • 使用h5d打开数据集
  • 使用h5s选择空间

等等...

但现在我正在使用Python,并且发现它的h5py库有两种管理HDF5的方式:高级接口和低级接口。使用前者,获取文件中单个变量的信息所需的代码行数更少。

当使用高级接口时,是否会出现明显的性能损失?例如,在处理包含多个变量的文件并且我们只需要读取其中一个变量时。


在大多数情况下,不应该有明显的差异。为什么不进行性能分析并查看呢? - Joe Kington
性能分析是我接下来要做的事情之一,但任何已经面对过这个问题的人的意见都非常宝贵! - Nicolás Ozimica
1个回答

2

一般来说,高级接口会带来某种程度的性能损失。然而,是否明显(值得调查)取决于您在代码中的具体操作。

首先从高级接口开始。如果代码整体过慢,就开始分析并将瓶颈降至低级接口,看看是否有所帮助。


网页内容由stack overflow 提供, 点击上面的
可以查看英文原文,
原文链接