我有一个大型的数据集,约有1000万条记录,我的程序需要进行很多成员资格检查...
if a in data:
return True
return False
目前我拥有的数据是字典项,其所有值均为“1”。
我还有一个使用算法来找到相同信息的程序,但目前它比字典方法慢,然而我预计数据的大小将继续增长...
对于我的当前字典解决方案,将data作为frozenset、set(或其他什么?)类型更快吗?
而对于未来,如何在可哈希类型的大小增加时检查成员资格的速度是否与之相关?一亿条记录的字典仍然快吗?
return a in data
。 - Hyperboreus