我希望在每个分组的第一行中添加一个新行,我的原始数据框如下:
```html
对于每个人('ID'),我希望在每个组('ID')的第一行上创建一个新的重复行,所创建行中'ID'、'From_num'和'To_num'的值应与上一个第一行相同,但'Date'的值为旧的第一行的'Date'加上一天。例如对于James来说,新创建的行的值是:'James' '78' '96' '2020-05-13',其余数据相同,因此我的期望结果是:
```html
我希望在每个分组的第一行中添加一个新行,我的原始数据框如下:
```df = pd.DataFrame({
'ID': ['James', 'James', 'James','Max', 'Max', 'Max', 'Max','Park','Tom', 'Tom', 'Tom', 'Tom','Wong'],
'From_num': [78, 420, 'Started', 298, 36, 298, 'Started', 'Started', 60, 520, 99, 'Started', 'Started'],
'To_num': [96, 78, 420, 36, 78, 36, 298, 311, 150, 520, 78, 99, 39],
'Date': ['2020-05-12', '2020-02-02', '2019-06-18',
'2019-06-20', '2019-01-30', '2018-10-23',
'2018-08-29', '2020-05-21', '2019-11-22',
'2019-08-26', '2018-12-11', '2018-10-09', '2019-02-01']})
它就像这样:
ID From_num To_num Date
0 James 78 96 2020-05-12
1 James 420 78 2020-02-02
2 James Started 420 2019-06-18
3 Max 298 36 2019-06-20
4 Max 36 78 2019-01-30
5 Max 298 36 2018-10-23
6 Max Started 298 2018-08-29
7 Park Started 311 2020-05-21
8 Tom 60 150 2019-11-22
9 Tom 520 520 2019-08-26
10 Tom 99 78 2018-12-11
11 Tom Started 99 2018-10-09
12 Wong Started 39 2019-02-01
对于每个人('ID'),我希望在每个组('ID')的第一行上创建一个新的重复行,所创建行中'ID'、'From_num'和'To_num'的值应与上一个第一行相同,但'Date'的值为旧的第一行的'Date'加上一天。例如对于James来说,新创建的行的值是:'James' '78' '96' '2020-05-13',其余数据相同,因此我的期望结果是:
ID From_num To_num Date
0 James 78 96 2020-05-13 # row added, Date + 1
1 James 78 96 2020-05-12
2 James 420 78 2020-02-02
3 James Started 420 2019-06-18
4 Max 298 36 2019-06-21 # row added, Date + 1
5 Max 298 36 2019-06-20
6 Max 36 78 2019-01-30
7 Max 298 36 2018-10-23
8 Max Started 298 2018-08-29
9 Park Started 311 2020-05-22 # Row added, Date + 1
10 Park Started 311 2020-05-21
11 Tom 60 150 2019-11-23 # Row added, Date + 1
12 Tom 60 150 2019-11-22
13 Tom 520 520 2019-08-26
14 Tom 99 78 2018-12-11
15 Tom Started 99 2018-10-09
16 Wong Started 39 2019-02-02 # Row added Date + 1
17 Wong Started 39 2019-02-01
我编写了一些循环条件,但是运行速度相当慢,如果你有什么好的想法,请帮忙。非常感谢。