如何对一个字符串列表进行排序?

488

在Python中创建按字母顺序排序的列表的最佳方法是什么?


1
使用 locale 和其字符串排序方法,根据当前区域设置自然排序。 - u0b34a0f6ae
11个回答

576

基本答案:

mylist = ["b", "C", "A"]
mylist.sort()

这会修改您原始的列表(即就地排序)。要获取已排序的列表副本,而不更改原始列表,请使用sorted()函数:

for x in sorted(mylist):
    print x

然而,以上示例有些幼稚,因为它们没有考虑区域设置,并执行区分大小写的排序。您可以利用可选参数key指定自定义排序顺序(使用cmp的替代方法已被弃用,因为它必须被多次评估,而key仅对每个元素计算一次)。

因此,要根据当前语言环境进行排序并考虑特定于语言的规则(cmp_to_key是functools中的辅助函数):

sorted(mylist, key=cmp_to_key(locale.strcoll))

最后,如果需要,您可以指定一个自定义区域设置进行排序:

import locale
locale.setlocale(locale.LC_ALL, 'en_US.UTF-8') # vary depending on your lang/locale
assert sorted((u'Ab', u'ad', u'aa'),
  key=cmp_to_key(locale.strcoll)) == [u'aa', u'Ab', u'ad']

最后提醒:你会看到一些不区分大小写排序的例子,使用了lower()方法 - 这些是不正确的,因为它们只适用于ASCII字符集的子集。对于任何非英语数据,这两个都是错误的:

# this is incorrect!
mylist.sort(key=lambda x: x.lower())
# alternative notation, a bit faster, but still wrong
mylist.sort(key=str.lower)

42
mylist.sort(key=str.lower) 更快。 - jfs
2
好的观点。我会保留我的当前示例,因为对于初学者来说,这可能更容易理解正在发生的事情,但我将在未来记住这一点。 - Eli Courtwright
1
如果有人好奇,可以在这里找到list.sort()的性能表现:https://dev59.com/z3I_5IYBdhLWcg3wHvQ5 - Hari Ganesan
1
@BornToCode:1- 我知道。看看我评论回复的修订版(2008年),我的评论是关于不必要使用lambda表达式的。2- 对非ASCII字符进行排序是一个大的独立主题。可以使用PyICU代替基于区域设置的解决方案。 - jfs
1
@Dmitry 这是因为你在 [1, 2, 3].sort() 中调用了 sort 函数的返回值。由于 sort() 直接对列表进行排序(即直接更改列表),它不会返回已排序的列表,实际上也不会返回任何内容,因此你的打印语句会输出 None。如果你将列表保存到一个变量中,比如说 x,然后调用 x.sort(),再打印 print(x),你就可以看到已排序的列表了。 - bjg222
显示剩余3条评论

61

值得一提的是sorted()函数:

for x in sorted(list):
    print x

这将返回一个新的已排序列表版本,而不更改原始列表。


40
list.sort()

就是这么简单 :)


总的来说,这个问题远比简单。但是好吧,最简单的情况其实是很简单的。 - Volker Siegel

19

正确的字符串排序方法是:

import locale
locale.setlocale(locale.LC_ALL, 'en_US.UTF-8') # vary depending on your lang/locale
assert sorted((u'Ab', u'ad', u'aa'), cmp=locale.strcoll) == [u'aa', u'Ab', u'ad']

# Without using locale.strcoll you get:
assert sorted((u'Ab', u'ad', u'aa')) == [u'Ab', u'aa', u'ad']

mylist.sort(key=lambda x: x.lower())这个示例适用于纯ASCII环境。


17

请在Python3中使用sorted()函数。

items = ["love", "like", "play", "cool", "my"]
sorted(items2)

8

但是它如何处理特定语言的排序规则?它会考虑语言环境吗?

不会,list.sort() 是一个通用的排序函数。如果你想按照 Unicode 规则排序,你需要定义一个自定义的排序键函数。你可以尝试使用 pyuca 模块,但我不知道它有多完整。


2
l =['abc' , 'cd' , 'xy' , 'ba' , 'dc']
l.sort()
print(l)

结果
['abc', 'ba', 'cd', 'dc', 'xy']

1

虽然这个问题比较老,但如果你想进行本地化排序而不设置 locale.LC_ALL,你可以按照 这个答案 的建议使用 PyICU 库 来实现:

import icu # PyICU

def sorted_strings(strings, locale=None):
    if locale is None:
       return sorted(strings)
    collator = icu.Collator.createInstance(icu.Locale(locale))
    return sorted(strings, key=collator.getSortKey)

然后使用例如以下方式调用:
new_list = sorted_strings(list_of_strings, "de_DE.utf8")

这对我有效,无需安装任何语言环境或更改其他系统设置。

(上面的评论已经建议了这一点,但我想更加突出它,因为我一开始错过了它。)


0
或者也许:
names = ['Jasmine', 'Alberto', 'Ross', 'dig-dog']
print ("The solution for this is about this names being sorted:",sorted(names, key=lambda name:name.lower()))

0
很简单: https://trinket.io/library/trinkets/5db81676e4
scores = '54 - Alice,35 - Bob,27 - Carol,27 - Chuck,05 - Craig,30 - Dan,27 - Erin,77 - Eve,14 - Fay,20 - Frank,48 - Grace,61 - Heidi,03 - Judy,28 - Mallory,05 - Olivia,44 - Oscar,34 - Peggy,30 - Sybil,82 - Trent,75 - Trudy,92 - Victor,37 - Walter'

scores = scores.split(',') for x in sorted(scores): print(x)

分数 = 分数.split(',') for x in sorted(分数): print(x)


网页内容由stack overflow 提供, 点击上面的
可以查看英文原文,
原文链接