我希望您能够快速找到以下内容的解决方法: 假设我有一个数组
X = np.array([1,1,1,2,2,2,2,2,3,3,1,1,0,0,0,5])
我想要的不是简单的元素频率,而是连续元素的频率。例如,首先数字1连续出现3次,然后数字2连续出现5次,接下来数字3连续出现2次,以此类推。如果freq
是我的函数,则:
Y = freq(X)
Y = np.array([[1,3],[2,5],[3,2],[1,2],[0,3],[5,1]])
例如,我可以使用循环来编写这个代码块,像这样:
def freq(X):
i=0
Y=[]
while i<len(X):
el = X[i]
el_count=0
while X[i]==el:
el_count +=1
i+=1
if i==len(X):
break
Y.append(np.array([el,el_count]))
return np.array(Y)
我正在寻找一种更快更好的方法来完成这个任务。谢谢!
itertools.groupby
。 - Dani Mesejo