我在R中没有找到这个常见分组问题的解决方案:
这是我的原始数据集。
这应该是我的分组结果数据集。
所以,思路是首先通过ID列(或时间戳列)对数据集进行排序。然后将所有没有间隔的连接状态分组在一起,并返回最小和最大ID值。这与rle方法有关,但这种方法不允许计算组的最小、最大值。
有什么想法吗?
这是我的原始数据集。
ID State
1 A
2 A
3 B
4 B
5 B
6 A
7 A
8 A
9 C
10 C
这应该是我的分组结果数据集。
State min(ID) max(ID)
A 1 2
B 3 5
A 6 8
C 9 10
所以,思路是首先通过ID列(或时间戳列)对数据集进行排序。然后将所有没有间隔的连接状态分组在一起,并返回最小和最大ID值。这与rle方法有关,但这种方法不允许计算组的最小、最大值。
有什么想法吗?