我有一个类似于以下的数据框:
>>> d = {'ID': ['ID1', 'ID2', 'ID3', 'ID4', 'ID5', 'ID6', 'ID7', 'ID8', 'ID9', 'ID10'],
'A': [1, 1, 1, 1, 2, 2, 2, 2, 2, 2],
'B': [145,158,240,250,199,204,300,350,467,578]}
>>> df = pd.DataFrame(data=d)
我想创建一个新系列
F
,用于标记每个100个单元格的B
列(从B
列中的第一个值开始计算,而不是从0开始)。B
列中的数字对于A
列中的每个数字都会“重新启动”。对于A
列中的新数字,它应该开始一个新的标志,并将B
列中相应的值作为新的100个范围的第一个数字。为了澄清,这种情况的预期结果应该是:>>> outcome = {'ID': ['ID1', 'ID2', 'ID3', 'ID4', 'ID5', 'ID6', 'ID7', 'ID8', 'ID9', 'ID10'],
'A': [1, 1, 1, 1, 2, 2, 2, 2, 2, 2],
'B': [145,158,240,250,199,204,300,350,467,578],
'F': ['F1','F1','F1','F2','F3','F4','F4','F5','F6','F7']}
>>> outcome
A B F
ID1 1 145 F1
ID2 1 158 F1
ID3 1 240 F1
ID4 1 250 F2
ID5 2 199 F3
ID6 2 204 F3
ID7 2 300 F4
ID8 2 350 F4
ID9 2 467 F5
ID10 2 578 F6
我希望你能够理解,提前感谢!