Python中的列表切片和寻找第二高的值

3
我需要编写一个函数,该函数以列表为参数并在列表中查找第二高的值。 返回该值。 如果列表中只有一个值,则返回该值。 如果列表为空,则返回0。
为创建列表,我提示用户输入数字,直到用户输入-1为止。 然后我提示用户输入起始位置(loc)和长度(len)。 我将提取从索引loc开始并具有长度len的列表切片,然后使用我的函数在该列表切片中查找第二高的值。
这是我目前拥有的代码:
userList = []

def main():
    inputList = int(input("Enter a number >= 0. Enter -1 to end input: "))
    while inputList != -1:
        userList.append(inputList)
        inputList = eval(input("Enter a number >= 0. Enter -1 to end input: "))

    return extractList(userList)

def extractList(userList):
    loc = int(input("Enter a starting location: "))
    length = int(input("Enter a lenghth: "))

    selSlice = userList[loc:loc + length]

    if len(selSlice) == 1:
        return selSlice[0]
    if len(selSlice) == 0:
        return 0

    num = max(selSlice)
    occ = userList.count(num)
    for i in range(occ):
        userList[userList.index(num):userList.index(num)+1] = ''

    print("Second highest value in ", selSlice, "is ", max(selSlice))

main()

我正在测试切片是否有效,但它似乎以loc的起始索引为起点,到len的结束索引为终点,而不是超出len的长度。

例如,如果我有一个列表:

[1, 3, 7, 21, 37, 76, 23, 91, 15, 11, 2, 4]

如果我的loc是3,len是6,那么结果应该是[21, 37, 76, 23, 91, 15]。但是我没有得到这个期望的结果,而是得到了[21, 37, 76]

我的extractList(a)应该是什么?如果您能帮我编写一个查找第二大值的函数,那就太好了。感谢任何帮助!

编辑:

好的,现在我在正确的轨道上了,感谢Chris ArenaTo Click or Not to Click的帮助。(代码已更新)

然而,上面的代码给出了整个列表中第二大的值,而不是切片后的列表。我不确定所有的变量是否正确。

如果我的userList[1, 3, 5, 7, 9, 2, 4, 6, 8, 10],我的位置是6,长度为4,我得到的结果应该是[4, 6, 8, 10],但是切片中第二高的值是9,它是userList中的第二高值,而不是切片中的。
我尝试将userList更改为从if len(userList) == 1:开始到结尾的selSlice,以查看是否有所不同。确实有所不同,但结果是可疑的(即错误的)。我使用了前面段落提到的相同的userList、loc和length。我得到的切片是[4, 6, 8](错误的),第二高的值是8,这对于程序返回的切片来说是错误的,但对于我请求的切片来说是正确的。所以我不确定这里可能出了什么问题。有什么建议吗?

我的最新代码显示了正确的切片,但是第二高的值错误。我得到的结果是:[4, 6, 8, 10]中第二高的值为10 不确定需要修复什么 =\


1
不要不必要地使用 eval,这可能会导致发生危险的事情。 - devnull
我认为在我的代码中这并不是不必要的,除非有另一种方法可以获取用户输入的数字。 - annabananana7
@devnull true,@annabananana7 尝试使用 ast.literal_eval 代替。 - A.J. Uppal
附言:这与您的主要问题无关,但重复您的“输入数字”文本是一种常见的反模式。您可以阅读此问题以了解原因的讨论:https://dev59.com/32Ag5IYBdhLWcg3ws8ro - DSM
@DSM 谢谢!我下次会记住的 :) - annabananana7
对于在 StackOverflow 上遇到这个问题的访问者,但寻求一个即时、实际且非学术性的解决方案来查找未排序列表中的第 k 个值,请使用 heapq - kojiro
4个回答

4

尝试以下方法以获得第二高的值:

def extract(arr, start, finish):
    if start < 0 or finish > len(arr)-1:
        return "Please enter valid start/end points"
    lst = arr[start:finish]
    if len(lst) == 1:
        return lst[0]
    if len(lst) == 0:
        return 0
    num = max(lst)
    occ = lst.count(num)
    for i in range(occ):
        lst[lst.index(num):lst.index(num)+1] = ''
    return max(lst)

这将作为以下方式运行:

>>> extract([6, 7, 8, 9, 1, 5, 3, 7, 2], -1, 8)
'Please enter valid start/end points'
>>> extract([6, 7, 8, 9, 1, 5, 3, 7, 2], -3, 8)
'Please enter valid start/end points'
>>> extract([6, 7, 8, 9, 1, 5, 3, 7, 2], 3, 8)
7
>>> 

几个小建议:

不要使用 evaleval 很危险。如果你必须使用类似于 eval 的函数,请尝试使用 ast.literal_eval(),或者直接转换为 int()

这是您编辑过的代码:

userList = []

def main():
    inputList = int(input("Enter a number >= 0. Enter -1 to end input: "))
    while inputList != -1:
        userList.append(inputList)
        inputList = eval(input("Enter a number >= 0. Enter -1 to end input: "))

    return extractList(userList)

def extractList(userList):
    loc = int(input("Enter a starting location: "))
    length = int(input("Enter a lenghth: "))

    selSlice = userList[loc:loc + length]
    orig = list(selSlice)

    if len(selSlice) == 1:
        return selSlice[0]
    if len(selSlice) == 0:
        return 0

    num = max(selSlice)
    occ = selSlice.count(num)
    for i in range(occ):
        selSlice[selSlice.index(num):selSlice.index(num)+1] = ''

    print("Second highest value in ", orig, "is ", max(selSlice))

main()

这是作为以下内容运行:

bash-3.2$ python3 test.py
Enter a number >= 0. Enter -1 to end input: 2
Enter a number >= 0. Enter -1 to end input: 7
Enter a number >= 0. Enter -1 to end input: 4
Enter a number >= 0. Enter -1 to end input: 9
Enter a number >= 0. Enter -1 to end input: 3
Enter a number >= 0. Enter -1 to end input: 1
Enter a number >= 0. Enter -1 to end input: 6
Enter a number >= 0. Enter -1 to end input: 4
Enter a number >= 0. Enter -1 to end input: 2
Enter a number >= 0. Enter -1 to end input: 8
Enter a number >= 0. Enter -1 to end input: 4
Enter a number >= 0. Enter -1 to end input: 2
Enter a number >= 0. Enter -1 to end input: 4
Enter a number >= 0. Enter -1 to end input: 3
Enter a number >= 0. Enter -1 to end input: 7
Enter a number >= 0. Enter -1 to end input: -1
Enter a starting location: 2
Enter a lenghth: 12
Second highest value in  [4, 9, 3, 1, 6, 4, 2, 8, 4, 2, 4, 3] is  8
bash-3.2$ 

另一种方法:

您可以使用sorted()并获取倒数第二个值:

userList = []

def main():
    inputList = int(input("Enter a number >= 0. Enter -1 to end input: "))
    while inputList != -1:
        userList.append(inputList)
        inputList = eval(input("Enter a number >= 0. Enter -1 to end input: "))

    return extractList(userList)

def extractList(userList):
    loc = int(input("Enter a starting location: "))
    length = int(input("Enter a lenghth: "))

    selSlice = userList[loc:loc + length]

    if len(selSlice) == 1:
        return selSlice[0]
    if len(selSlice) == 0:
        return 0

    num = sorted(selSlice)[-2]

    print("Second highest value in ", selSlice, "is ", num)

main()

这段代码的运行结果为:

bash-3.2$ python3 test.py
Enter a number >= 0. Enter -1 to end input: 2
Enter a number >= 0. Enter -1 to end input: 7
Enter a number >= 0. Enter -1 to end input: 4
Enter a number >= 0. Enter -1 to end input: 9
Enter a number >= 0. Enter -1 to end input: 3
Enter a number >= 0. Enter -1 to end input: 1
Enter a number >= 0. Enter -1 to end input: 6
Enter a number >= 0. Enter -1 to end input: 4
Enter a number >= 0. Enter -1 to end input: 2
Enter a number >= 0. Enter -1 to end input: 8
Enter a number >= 0. Enter -1 to end input: 4 
Enter a number >= 0. Enter -1 to end input: 2
Enter a number >= 0. Enter -1 to end input: 4
Enter a number >= 0. Enter -1 to end input: 3
Enter a number >= 0. Enter -1 to end input: 7
Enter a number >= 0. Enter -1 to end input: -1
Enter a starting location: 2
Enter a lenghth: 12
Second highest value in  [4, 9, 3, 1, 6, 4, 2, 8, 4, 2, 4, 3] is  8
bash-3.2$

顺便说一下,我对我的更新进行了更新,如果您能看一下并查看我的代码有什么问题,请告诉我。 - annabananana7
修改总是这么简单吗?通常看到它们后我会感觉很愚蠢哈哈。非常感谢!! - annabananana7
我喜欢帮助他人 :) 如果您不介意的话,能否顺便点个赞或接受答案呢?谢谢! - A.J. Uppal
1
只是一个小注释:在较大的列表上,sorted(set(selSlice))[-2] 可能比 sorted(selSlice)[-2] 快得多,因为 set 可以消除所有重复项。 - dawg

1
一些关于Python最佳实践的建议:
最好使用int()来处理输入,而不是使用eval()。由于各种原因,eval()不安全。如果你调用int(),它会立即抛出异常,如果用户提供了一个错误的值(例如字符串'blah')。然后,您可以捕获此异常并不将错误值添加到列表中。如果用户可以输入非整数,则应使用float()。
此外,您不希望覆盖内置名称,在这种情况下是'len'。为该变量选择一个不同的名称。
当您在可迭代对象(如列表)上进行切片时,可以将切片留空,并智能地选择新列表需要的内容。例如,userList[loc:], userList[:], userList[:3]。
最后,似乎您应该获取起始位置并获取接下来的'长度'个字符。因此,您需要使用userList[loc:loc+length]...这也有可能失败,如果用户提供的值比您的列表容量更多,请在这里进行一些错误检查。

太好了,我真的明白了哈哈。谢谢,现在切片可以用了 :) - annabananana7

0

切片很简单:

li=[1, 3, 7, 21, 37, 76, 23, 91, 15, 11, 2, 4]

loc=3
run=6

sl=li[loc:loc+run]

print(sl)
# [21, 37, 76, 23, 91, 15]

然后第二高:

print(sorted(set(sl))[-2])   # use 'set' in case there are duplicates...
# 76

寻找第二大的各种方法的时间:

def f1(li):
    return sorted(set(li))[-2]

def f2(li):
    max_n=max(li)
    while max_n in li:
        li.remove(max_n)

    return max(li)

def f3(li):
    set_li=set(li)
    set_li.remove(max(set_li))
    return max(set_li)

def f4(li):
    max_n=max(li)
    li_=[x for x in li if x!=max_n]   
    return max(li_)

def f5(li):
    return sorted(li)[-2]    


if __name__ =='__main__':
    import timeit   
    import random
    li=[random.randint(0, 100) for _ in range(100000)]  
    for f in (f1, f2, f3, f4, f5):
        print('{}: {:.4} secs'.format(f.__name__,
                   timeit.timeit("f(li[:])", setup="from __main__ import li, f", number=10)))

输出:

f1: 0.01876 secs
f2: 14.61 secs         # OUCH
f3: 0.01861 secs
f4: 0.09974 secs
f5: 0.2418 secs

你可以看到,对唯一值进行排序是获取第N高(或低)值的一种相当快速的方法。

对一个列表进行排序的成本为O(nlog(n)),而仅查找最大值的成本为O(n)。 - heroandtn3
1
@heroandtn3:查看时间以确定这并不总是正确的。 - dawg

0
另一种从列表中删除项目的方法是使用remove(value)方法,例如:
while maxValue in lst:
    lst.remove(maxValue)

此外,最好编写一个独立的函数来查找列表中第二高的值。需要注意的是,在调用此函数之后,lst将被修改:
def extractSecondHighest(lst):
    """
    Extraction second highest value from lst.
    """
    #lst = lst[:] <-- uncomment this line if you don't want `lst` to be modified 
    if len(lst) == 1:
        return lst[0]
    if len(lst) == 0:
        return 0

    maxValue = max(lst) # obtain max value
    while maxValue in lst: # while lst has maxValue, remove it
        lst.remove(maxValue)
    return max(lst)

那么,你的extractList函数将是:

def extractList(userList):
    loc = int(input("Enter a starting location: "))
    length = int(input("Enter a lenghth: "))

    selSlice = userList[loc:loc + length] # don't forget to check exception when loc + length is larger then list's length

    secondHighest = extractSecondHighest(selSlice)

    print("Second highest value in", userList, "is", secondHighest)

网页内容由stack overflow 提供, 点击上面的
可以查看英文原文,
原文链接