我的朋友需要读取大量(大约18000个数据集)格式非常恼人的数据,这些数据应该是8列和~8000行,但实际上,数据以7列的形式呈现,最后一个条目会溢出到下一行的第一列。此外,每隔约30行只有4列数据,因为某个上游程序正在将200 x 280数组重塑为7x8120数组。我的问题是:我们如何将数据读入8x7000数组中。我的通常方法np.loadtxt和np.genfromtxt在列数不均匀的情况下失败。请记住,性能是一个因素,因为这必须对约18000个数据文件执行。以下是典型数据文件的链接:http://users-phys.au.dk/hha07/hk_L1.ref。