我有一个以下的数据框:
Col1 Col2 Col3
A ABC 100
B BCD 200
C CDA 300
D CDA 400
E CDA 500
F EFG 600
G XYZ 700
H XYZ 800
I PQR 900
我们可以看到在Col2中,CDA重复了3次,而XYZ重复了2次。
现在我需要创建新列 NewCol4 并检查连续值,如果存在连续值,就在最后加下划线并加上数字,如果不是连续值,则保持原样。
我需要以下格式的输出。
Col1 Col2 Col3 NewCol4
A ABC 100 ABC
B BCD 200 BCD
C CDA 300 CDA_1
D CDA 400 CDA_2
E CDA 500 CDA_3
F EFG 600 EFG
G XYZ 700 XYZ_1
H XYZ 800 XYZ_2
I PQR 900 PQR
我对Pandas非常陌生,有没有办法实现上述输出,这将非常有帮助。