我是一名新手,从MATLAB转到Python。我的问题与此帖子非常相似(在一个列表中查找任何元素出现在另一个列表中的索引),但有一些调整我无法完全整合(即处理重复项和缺失值)。
按照该示例,我有两个列表:haystack和needles:
haystack = ['A', 'B', 'C', 'D', 'E', 'F', 'G', 'H', 'J', 'K']
needles = ['F', 'G', 'H', 'I', 'F', 'K']
然而,无论是“haystack”还是“needles”,都是日期列表。我需要在“haystack”中为每个“needles”的元素创建一个索引列表,使得:
result = [5, 6, 7, nan, 5, 9]
我的问题与发布的示例有两个主要不同之处: 1. 我的 needles 中有重复项(haystack 中没有任何重复项),据我所知这意味着我不能使用 set() 2. 很少情况下,needles 中的一个元素可能不存在于 haystack 中,在这种情况下,我希望插入 nan(或其他占位符)
到目前为止,我已经得到了这个代码(对于 haystack 和 needles 太大而不够高效):
import numpy as np
def find_idx(a,func):
return [i for (i,val) in enumerate(a) if func(val)]
haystack = ['A', 'B', 'C', 'D', 'E', 'F', 'G', 'H', 'J', 'K']
needles = ['F', 'G', 'H', 'I', 'F', 'K']
result=[]
for x in needles:
try:
idx = find_idx(haystack, lambda y: y==x)
result.append(idx[0])
except:
result.append(np.nan)
据我所知,那段代码可以实现我的要求,但速度不够快。有更高效的替代方案吗?
[ haystack.index(x) if x in haystack else None for x in needles ]
。 - Onyambu