我有一个数组traced_descIDs
,其中包含对象ID,我想确定在这个数组中哪些项不是唯一的。然后,对于每个唯一的重复(小心),我需要确定与之相关联的traced_descIDs
索引。
举个例子,如果我们看一下这里的traced_descIDs,我希望进行以下过程:
traced_descIDs = [1, 345, 23, 345, 90, 1]
dupIds = [1, 345]
dupInds = [[0,5],[1,3]]
我当前正在查找有超过1个条目的对象:
mentions = np.array([len(np.argwhere( traced_descIDs == i)) for i in traced_descIDs])
dupMask = (mentions > 1)
然而,由于len(traced_descIDs)
大约为150,000,这需要太长时间。有没有更快的方法来实现相同的结果呢?
非常感谢任何帮助。谢谢。