我有一个来自SAP的文件,这个文件在处理数据时并不是最好看的。因此,使用series.str.contains()
和布尔掩码,我成功地将其缩小到了以下的数据框中:
0 1
0 SUB 123
1 CAT SKU
2 CODE 1000123
3 CODE 1000234
4 SUB 456
5 CAT LIQ
6 CODE1 1000345
7 CODE1 1000534
8 CODE1 1000433
我正在寻找一种方法,可以将每个SUB
分别放入一个新的条目中,就像下面这样:
print(expected_df)
SUB CAT CODE CODE1
0 123 SKU 1000123.0 NaN
1 123 SKU 1000234.0 NaN
2 456 LIQ NaN 1000345.0
3 456 LIQ NaN 1000534.0
4 456 LIQ NaN 1000433.0
我似乎无法通过这一步。然而,这行代码:
df[0].eq('SUB').cumsum()
有助于分组,并且可以在需要时用作辅助系列。
非常感谢您协助转置数据。
谢谢。
SUB
是否总是有一个CAT
? - Jondiedoop