我正在尝试从元组列表中获取第n个元素。
我的代码类似于:
elements = [(1,1,1),(2,3,7),(3,5,10)]
我希望仅将每个元组的第二个元素提取到列表中:seconds = [1, 3, 5]
我知道可以使用 for
循环完成,但由于我有成千上万个元组,所以想知道是否还有其他方式。
n = 1 # N. . .
[x[n] for x in elements]
这种方法也可以:
zip(*elements)[1]
(我主要发布这篇文章是为了证明我已经理解了 zip
...)
看它的作用:
>>> help(zip)
内置函数zip的帮助信息,它在模块中:
zip(...)
zip(seq1 [, seq2 [...]]) -> [(seq1[0], seq2[0] ...), (...)]
返回一个元组列表,其中每个元组包含来自每个参数序列的第i个元素。 返回的列表长度被截断为最短参数序列的长度。
>>> elements = [(1,1,1),(2,3,7),(3,5,10)]
>>> zip(*elements)
[(1, 2, 3), (1, 3, 5), (1, 7, 10)]
>>> zip(*elements)[1]
(1, 3, 5)
>>>
今天我学到的一个好东西:在函数参数中使用*list
来创建参数列表...
注意:在Python3中,zip
返回一个迭代器,所以改用list(zip(*elements))
来返回元组的列表。
我知道可以用FOR做到,但我想知道是否还有其他方法
还有另一种方式。您也可以使用map和itemgetter实现:
>>> from operator import itemgetter
>>> map(itemgetter(1), elements)
尽管如此,这种方法仍然在内部执行循环,并且比列表推导式略慢:
setup = 'elements = [(1,1,1) for _ in range(100000)];from operator import itemgetter'
method1 = '[x[1] for x in elements]'
method2 = 'map(itemgetter(1), elements)'
import timeit
t = timeit.Timer(method1, setup)
print('Method 1: ' + str(t.timeit(100)))
t = timeit.Timer(method2, setup)
print('Method 2: ' + str(t.timeit(100)))
结果:
方法一:1.25699996948 方法二:1.46600008011
如果您需要遍历列表,则使用 for
是可以的。
在搜索如何快速获取2元组列表的第二个元素时,我发现了这个。虽然不是我想要的,但我进行了与第三种方法相同的测试,并测试了zip方法。
setup = 'elements = [(1,1) for _ in range(100000)];from operator import itemgetter'
method1 = '[x[1] for x in elements]'
method2 = 'map(itemgetter(1), elements)'
method3 = 'dict(elements).values()'
method4 = 'zip(*elements)[1]'
import timeit
t = timeit.Timer(method1, setup)
print('Method 1: ' + str(t.timeit(100)))
t = timeit.Timer(method2, setup)
print('Method 2: ' + str(t.timeit(100)))
t = timeit.Timer(method3, setup)
print('Method 3: ' + str(t.timeit(100)))
t = timeit.Timer(method4, setup)
print('Method 4: ' + str(t.timeit(100)))
Method 1: 0.618785858154
Method 2: 0.711684942245
Method 3: 0.298138141632
Method 4: 1.32586884499
如果你有一个2元组对,只需将其转换为字典并获取值,速度会快两倍以上。
dict(elements).values()
将导致一个元素的字典,而不是列表推导或映射。这正是我想要的(我对唯一的touples感兴趣)(+1和非常感谢您的发布),但其他人可能会想知道为什么dict更快-它不是分配内存,而只是检查现有元素。 - Greg0ry提取2元组列表中第二个元素的Python 3.6时间设置。
此外,添加了numpy
数组方法,这种方法更易于阅读(但有人认为比列表推导式更简单)。
from operator import itemgetter
elements = [(1,1) for _ in range(100000)]
%timeit second = [x[1] for x in elements]
%timeit second = list(map(itemgetter(1), elements))
%timeit second = dict(elements).values()
%timeit second = list(zip(*elements))[1]
%timeit second = np.array(elements)[:,1]
以及时间安排:
list comprehension: 4.73 ms ± 206 µs per loop
list(map): 5.3 ms ± 167 µs per loop
dict: 2.25 ms ± 103 µs per loop
list(zip) 5.2 ms ± 252 µs per loop
numpy array: 28.7 ms ± 1.88 ms per loop
map()
和zip()
不再返回列表,因此需要进行显式转换。dict().values()
需要同样的 list
。 - hpauljmap (lambda x:(x[1]),elements)
我喜欢@daren的回答,但它会出现错误,因为您无法对zip
迭代器进行切片,所以它不可订阅。相反,您需要将zip
添加到list
中,以根据索引提取所需的元素。
elements = [(1,1,1),(2,3,7),(3,5,10)]
slices = list(zip(*elements))[1]
输出:
(1, 3, 5)
>>> from itertools import chain, islice
>>> elements = [(1,1,1),(2,3,7),(3,5,10)]
>>> list(chain.from_iterable(islice(item, 1, 2) for item in elements))
[1, 3, 5]
当你需要多个元素时,这将非常有用:
>>> elements = [(0, 1, 2, 3, 4, 5),
(10, 11, 12, 13, 14, 15),
(20, 21, 22, 23, 24, 25)]
>>> list(chain.from_iterable(islice(tuple_, 2, 5) for tuple_ in elements))
[2, 3, 4, 12, 13, 14, 22, 23, 24]
**dict
创建关键字参数:def test(foo=3, bar=3): return foo*bar
,然后d = {'bar': 9, 'foo': 12}; print test(**d)
- Wayne Werner