我正在尝试为每个事件/剧集生成唯一的ID,然后想根据生成的ID计算一列的平均值。
以下是一个示例:
事件 | 数值 |
---|---|
A | 3 |
A | 5 |
A | 1 |
B | 8 |
B | 2 |
C | 1 |
C | 3 |
A | 2 |
A | 5 |
首先,我想创建如下的ID列:
事件 | 价值 | ID |
---|---|---|
A | 3 | A1 |
A | 5 | A1 |
A | 1 | A1 |
B | 8 | B1 |
B | 2 | B1 |
C | 1 | C1 |
C | 3 | C1 |
A | 2 | A2 |
A | 5 | A2 |
其次,我想基于生成的ID列计算'价值'的平均值。
感谢您的帮助和建议。
我尝试了'cumsum'和'duplicated'函数,但它们倾向于生成连续的ID号码。
rleid
+1 - Maël