我被分配了一个相当大的Excel文件(5k行),也有一个CSV版本,我想将其制作成pandas多级DataFame。该文件的结构如下:
SampleID OtherInfo Measurements Error Notes
sample1 stuff more stuff
36 6
26 7
37 8
sample2 newstuff lots of stuff
25 6
27 7
在这个相关it技术的问题中,需要翻译的内容是:当测量数量是可变的(有时为零)时。任何信息之间都没有完全空白的行,而“测量”和“误差”列在具有其他(字符串)数据的行上为空;这可能会使解析更加困难。是否有一种简单的方法来自动完成此转换?我的初始想法是先用Python解析文件,然后在循环中将内容输入DataFrame插槽,但我不知道如何实现,或者它是否是最佳操作方法。
谢谢!