如何从元组列表中提取第n个元素

149

我正在尝试从元组列表中获取第n个元素。

我的代码类似于:

elements = [(1,1,1),(2,3,7),(3,5,10)]
我希望仅将每个元组的第二个元素提取到列表中:
seconds = [1, 3, 5]

我知道可以使用 for 循环完成,但由于我有成千上万个元组,所以想知道是否还有其他方式。

8个回答

239
n = 1 # N. . .
[x[n] for x in elements]

48

这种方法也可以:

zip(*elements)[1]

(我主要发布这篇文章是为了证明我已经理解了 zip...)

看它的作用:

>>> help(zip)

内置函数zip的帮助信息,它在模块中:

zip(...)

zip(seq1 [, seq2 [...]]) -> [(seq1[0], seq2[0] ...), (...)]

返回一个元组列表,其中每个元组包含来自每个参数序列的第i个元素。 返回的列表长度被截断为最短参数序列的长度。

>>> elements = [(1,1,1),(2,3,7),(3,5,10)]
>>> zip(*elements)
[(1, 2, 3), (1, 3, 5), (1, 7, 10)]
>>> zip(*elements)[1]
(1, 3, 5)
>>>

今天我学到的一个好东西:在函数参数中使用*list来创建参数列表...

注意:在Python3中,zip返回一个迭代器,所以改用list(zip(*elements))来返回元组的列表。


3
使用**dict创建关键字参数:def test(foo=3, bar=3): return foo*bar,然后d = {'bar': 9, 'foo': 12}; print test(**d) - Wayne Werner
4
真实故事 - 我发现在我经常使用的任何东西中(如 Python、vim),我往往需要提醒一些我已经忘记的好玩/酷炫功能,因为我不是那么经常使用它们。 - Wayne Werner
列表语法非常有用。您知道它在官方Python文档中的描述在哪里吗? - user1748155
1
这非常整洁! - dhdhagar
8
不再起作用,可能是在从Python 2转换到3过程中丢失了: "TypeError:'zip' object is not subscriptable." zip函数现在不返回列表,而是一个“zip”对象。请注意,“zip”对象不可被下标引用。 - dsteinhoefel
显示剩余2条评论

31

我知道可以用FOR做到,但我想知道是否还有其他方法

还有另一种方式。您也可以使用mapitemgetter实现:

>>> from operator import itemgetter
>>> map(itemgetter(1), elements)

尽管如此,这种方法仍然在内部执行循环,并且比列表推导式略慢:

setup = 'elements = [(1,1,1) for _ in range(100000)];from operator import itemgetter'
method1 = '[x[1] for x in elements]'
method2 = 'map(itemgetter(1), elements)'

import timeit
t = timeit.Timer(method1, setup)
print('Method 1: ' + str(t.timeit(100)))
t = timeit.Timer(method2, setup)
print('Method 2: ' + str(t.timeit(100)))

结果:

方法一:1.25699996948
方法二:1.46600008011

如果您需要遍历列表,则使用 for 是可以的。


2
一个小补充:在Python 3.x中,基准测试将显示map仅需要几分之一毫秒的时间。这是因为它将返回一个迭代器。method2 = 'list(map(itemgetter(1), elements))'呈现了旧的行为。 - Maik Beckmann

13

在搜索如何快速获取2元组列表的第二个元素时,我发现了这个。虽然不是我想要的,但我进行了与第三种方法相同的测试,并测试了zip方法。

setup = 'elements = [(1,1) for _ in range(100000)];from operator import itemgetter'
method1 = '[x[1] for x in elements]'
method2 = 'map(itemgetter(1), elements)'
method3 = 'dict(elements).values()'
method4 = 'zip(*elements)[1]'

import timeit
t = timeit.Timer(method1, setup)
print('Method 1: ' + str(t.timeit(100)))
t = timeit.Timer(method2, setup)
print('Method 2: ' + str(t.timeit(100)))
t = timeit.Timer(method3, setup)
print('Method 3: ' + str(t.timeit(100)))
t = timeit.Timer(method4, setup)
print('Method 4: ' + str(t.timeit(100)))

Method 1: 0.618785858154
Method 2: 0.711684942245
Method 3: 0.298138141632
Method 4: 1.32586884499

如果你有一个2元组对,只需将其转换为字典并获取值,速度会快两倍以上。


这可能很明显,但我想提一下dict(elements).values()将导致一个元素的字典,而不是列表推导或映射。这正是我想要的(我对唯一的touples感兴趣)(+1和非常感谢您的发布),但其他人可能会想知道为什么dict更快-它不是分配内存,而只是检查现有元素。 - Greg0ry

7

提取2元组列表中第二个元素的Python 3.6时间设置。

此外,添加了numpy数组方法,这种方法更易于阅读(但有人认为比列表推导式更简单)。

from operator import itemgetter
elements = [(1,1) for _ in range(100000)]

%timeit second = [x[1] for x in elements]
%timeit second = list(map(itemgetter(1), elements))
%timeit second = dict(elements).values()
%timeit second = list(zip(*elements))[1]
%timeit second = np.array(elements)[:,1]

以及时间安排:

list comprehension:  4.73 ms ± 206 µs per loop
list(map):           5.3 ms ± 167 µs per loop
dict:                2.25 ms ± 103 µs per loop
list(zip)            5.2 ms ± 252 µs per loop
numpy array:        28.7 ms ± 1.88 ms per loop

请注意,map()zip()不再返回列表,因此需要进行显式转换。

dict().values() 需要同样的 list - hpaulj
@Oleg,我不理解在“dict”方法中代码如何理解我们要查看第二个元素。这是因为值==1的默认设置吗?比如说,如果需要对第3个或第10个元素执行相同的操作,那么在“dict”方法中有什么变化? - msh855

3
map (lambda x:(x[1]),elements)

9
考虑增加一些解释。 - fedorqui

1

我喜欢@daren的回答,但它会出现错误,因为您无法对zip迭代器进行切片,所以它不可订阅。相反,您需要将zip添加到list中,以根据索引提取所需的元素。

elements = [(1,1,1),(2,3,7),(3,5,10)]
slices = list(zip(*elements))[1]

输出:

(1, 3, 5)

1

使用islicechain.from_iterable:

>>> from itertools import chain, islice
>>> elements = [(1,1,1),(2,3,7),(3,5,10)]
>>> list(chain.from_iterable(islice(item, 1, 2) for item in elements))
[1, 3, 5]

当你需要多个元素时,这将非常有用:

>>> elements = [(0, 1, 2, 3, 4, 5), 
                (10, 11, 12, 13, 14, 15), 
                (20, 21, 22, 23, 24, 25)]
>>> list(chain.from_iterable(islice(tuple_, 2, 5) for tuple_ in elements))
[2, 3, 4, 12, 13, 14, 22, 23, 24]

网页内容由stack overflow 提供, 点击上面的
可以查看英文原文,
原文链接