我的问题来源于回答如何在Python 3中找到任意列表中的缺失数字?。
大多数解决方案建议使用类似于
大多数解决方案建议使用类似于
a = [10,12,13,8]
# get set of full numbers
allNums = set( (x for x in range(min(a),max(a)+1)))
# do some kind of set operation / symetric difference
这需要2次迭代a
来获取列表中的min(a)
和max(a)
作为值,以构建包括min(a)
和max(a)
之间所有数字的范围。
很容易将其简化为只需一次a
的操作:
def minmax(data):
"""Get the min and max of an iterable in O(n) time and constant space."""
minValue = data[0]
maxValue = data[0]
for d in data[1:]:
minValue = d if d < minValue else minValue
maxValue = d if d > maxValue else maxValue
return (minValue,maxValue)
有没有一种使用Python内置/模块的方法以O(n)时间和常量空间检索?
编辑: 同意:min()和max()也都是O(n) - 但使用两次(这是常数并减少到O(n) - 是的)- 但两次比一次慢。
带有一些基准测试的编辑:
import timeit
# 100k random numbers to min/max upon
data = """import random
random.seed(42)
data = random.choices(range(1000000),k=100000)"""
t1 = timeit.timeit("""
mi,ma=minmax(data)
""",setup="""
import functools
def minmax(aa):
return functools.reduce(lambda mm,xx : ( min(mm[0],xx),max(mm[1],xx)) , aa, ( aa[0],aa[0],))
""" + data, number = 1000 )
简单的最小值和最大值用法:
t2 = timeit.timeit("""
mi,ma=min(data),max(data)
""",setup=data, number = 1000)
使用if/elif一次尝试来减少比较:
t3 = timeit.timeit("""
mi,ma=minmax(data)
""",setup="""
def minmax(data):
minValue = data[0]
maxValue = data[0]
for d in data[1:]:
if d < minValue: # changed to if / elif: in a vain attempt to make it faster
minValue = d # its closer to the proposed solution in the numpy-question
elif d > maxValue: # linked above
maxValue = d
return (minValue,maxValue)
""" + data, number = 1000)
不使用 if/elif 的一次尝试(需要更多比较):
t4 = timeit.timeit("""
mi,ma=minmax(data)
""",setup="""
def minmax(data):
minValue = data[0]
maxValue = data[0]
for d in data[1:]:
minValue = d if d < minValue else minValue
maxValue = d if d > maxValue else maxValue
return (minValue,maxValue)
""" + data, number = 1000)
这导致:
minmanx-reduce: 148.5929143627707
default min + max: 3.376458476185718 # ouch .. seems we just use these
minmax1passOptimized: 15.975109436292087
minmax1pass: 20.29275910515082
min(list)
和max(list)
。 - bigbounty