我有以下列:
column
0 10
1 10
2 8
3 8
4 6
5 6
我的目标是找到今天的唯一值(在这种情况下为3),并创建一个新列,该列将创建以下内容:
new_column
0 3
1 3
2 2
3 2
4 1
5 1
编号从唯一值的长度(3)开始,如果当前行与前一行相同,则重复相同的数字。随着行值的变化,编号会逐渐减少。原始列中的所有唯一值具有相同数量的行(在这种情况下,每个唯一值有2行)。
我的解决方案是按原始列进行分组,并创建以下新列表:
i=1
new_time=[]
for j, v in df.groupby('column'):
new_time.append([i]*2)
i=i+1
那我会将列表平铺并按降序排序。还有其他更简单的解决方案吗?
谢谢。
pd.factorize
和np.unique
之间存在巨大的区别。pd.factorize
不排序,而np.unique
则会进行排序。@anky_91 - piRSquaredrank
。请看我的答案。 - Bharath M Shetty