我有一些数据,可以是列表的列表或元组的列表,就像这样:
data = [[1,2,3], [4,5,6], [7,8,9]]
data = [(1,2,3), (4,5,6), (7,8,9)]
我想按子集中的第二个元素进行排序。也就是说,按2、5、8排序,其中2
来自(1,2,3)
,5
来自(4,5,6)
。做到这一点的常见方法是什么?我应该在列表中存储元组还是列表?
我有一些数据,可以是列表的列表或元组的列表,就像这样:
data = [[1,2,3], [4,5,6], [7,8,9]]
data = [(1,2,3), (4,5,6), (7,8,9)]
我想按子集中的第二个元素进行排序。也就是说,按2、5、8排序,其中2
来自(1,2,3)
,5
来自(4,5,6)
。做到这一点的常见方法是什么?我应该在列表中存储元组还是列表?
sorted_by_second = sorted(data, key=lambda tup: tup[1])
或者:
data.sort(key=lambda tup: tup[1]) # sorts in place
默认的排序模式是升序。要按降序排序,请使用选项 reverse=True
:
sorted_by_second = sorted(data, key=lambda tup: tup[1], reverse=True)
或者:
data.sort(key=lambda tup: tup[1], reverse=True) # sorts in place
key=itemgetter(1)
并在文件开头添加:from operator import itemgetter
。 - Joschuasort
是Python中List
对象的一个方法,它接收一个lambda函数作为key
参数。你可以将其命名为tup
、t
或其他任何名称,它仍然可以工作。这里的tup
指定了列表元组的索引,所以1
意味着排序将按原始列表中元组的第二个值(2、5、8
)进行排序。 - Neurotransmitter要按多个条件排序,例如按元组中的第二个和第三个元素进行排序,请使用
data = [(1,2,3),(1,2,1),(1,1,4)]
因此,定义一个返回描述优先级的元组的lambda函数,例如
sorted(data, key=lambda tup: (tup[1],tup[2]) )
[(1, 1, 4), (1, 2, 1), (1, 2, 3)]
reverse = True
结果将如下所示:
data.sort(key=lambda tup: tup[1], reverse=True)
Stephen的回答是我会用的一个。为了完整起见,这里有一个使用列表推导式的DSU(装饰-排序-去装饰)模式:
decorated = [(tup[1], tup) for tup in data]
decorated.sort()
undecorated = [tup for second, tup in decorated]
或者更简洁地说:
[b for a,b in sorted((tup[1], tup) for tup in data)]
正如Python Sorting HowTo所指出的那样,自从Python 2.4之后,使用键函数已经不再需要了。
为了将一个元组列表 (<word>, <count>)
按照 count
降序和 word
字母顺序排序:
data = [
('betty', 1),
('bought', 1),
('a', 1),
('bit', 1),
('of', 1),
('butter', 2),
('but', 1),
('the', 1),
('was', 1),
('bitter', 1)]
我使用这种方法:
sorted(data, key=lambda tup:(-tup[1], tup[0]))
并且它给我了结果:
[('butter', 2),
('a', 1),
('betty', 1),
('bit', 1),
('bitter', 1),
('bought', 1),
('but', 1),
('of', 1),
('the', 1),
('was', 1)]
没有 lambda:
def sec_elem(s):
return s[1]
sorted(data, key=sec_elem)
itemgetter()
比lambda tup: tup[1]
略微更快,但其增速相对较小(大约为10%至25%)。
(IPython会话)
>>> from operator import itemgetter
>>> from numpy.random import randint
>>> values = randint(0, 9, 30000).reshape((10000,3))
>>> tpls = [tuple(values[i,:]) for i in range(len(values))]
>>> tpls[:5] # display sample from list
[(1, 0, 0),
(8, 5, 5),
(5, 4, 0),
(5, 7, 7),
(4, 2, 1)]
>>> sorted(tpls[:5], key=itemgetter(1)) # example sort
[(1, 0, 0),
(4, 2, 1),
(5, 4, 0),
(8, 5, 5),
(5, 7, 7)]
>>> %timeit sorted(tpls, key=itemgetter(1))
100 loops, best of 3: 4.89 ms per loop
>>> %timeit sorted(tpls, key=lambda tup: tup[1])
100 loops, best of 3: 6.39 ms per loop
>>> %timeit sorted(tpls, key=(itemgetter(1,0)))
100 loops, best of 3: 16.1 ms per loop
>>> %timeit sorted(tpls, key=lambda tup: (tup[1], tup[0]))
100 loops, best of 3: 17.1 ms per loop
@Stephen的回答很到位!这里有一个例子可以更好地进行可视化,
向《头号玩家》的粉丝们大喊一声! =)
>>> gunters = [('2044-04-05', 'parzival'), ('2044-04-07', 'aech'), ('2044-04-06', 'art3mis')]
>>> gunters.sort(key=lambda tup: tup[0])
>>> print gunters
[('2044-04-05', 'parzival'), ('2044-04-06', 'art3mis'), ('2044-04-07', 'aech')]
key
是一个函数,用于转换集合中的项目以进行比较。就像Java中的compareTo
方法。
传递给key的参数必须是可调用的。在这里,使用lambda
创建了一个匿名函数(它是可调用的)。
Lambda的语法是单词lambda,然后是一个可迭代的名称,然后是一块单独的代码。
下面的示例中,我们正在对包含某个事件和演员名称的时间信息元组列表进行排序。
我们正在按事件发生的时间(元组的第0个元素)对此列表进行排序。
注意 - s.sort([cmp[, key[, reverse]]])
会就地对s的项目进行排序。
。
#To sort the list based on each element's second integer (elem[1])
sorted(d2, key=lambda elem: elem[1])
根据您想要排序的元素,您可以将其放入
(elem[*insert the index of the element you are sorting it by*])
sorted
creates new list. To do in-place sorting use .sort(key=...)
- Shital Shah