如何对一个字符串列表进行排序？

Question

如何对一个字符串列表进行排序？

pythonstringsorting

488

在Python中创建按字母顺序排序的列表的最佳方法是什么？

- ziobro

1

使用 locale 和其字符串排序方法，根据当前区域设置自然排序。 - u0b34a0f6ae

11个回答

61

值得一提的是sorted()函数：

for x in sorted(list):
    print x

这将返回一个新的已排序列表版本，而不更改原始列表。

- Greg Hewgill

40

list.sort()

就是这么简单 :)

- rix0rrr

总的来说，这个问题远比简单。但是好吧，最简单的情况其实是很简单的。 - Volker Siegel

19

正确的字符串排序方法是：

import locale
locale.setlocale(locale.LC_ALL, 'en_US.UTF-8') # vary depending on your lang/locale
assert sorted((u'Ab', u'ad', u'aa'), cmp=locale.strcoll) == [u'aa', u'Ab', u'ad']

# Without using locale.strcoll you get:
assert sorted((u'Ab', u'ad', u'aa')) == [u'Ab', u'aa', u'ad']

mylist.sort(key=lambda x: x.lower())这个示例适用于纯ASCII环境。

- schmichael

17

请在Python3中使用sorted()函数。

items = ["love", "like", "play", "cool", "my"]
sorted(items2)

- Mahmud Ahsan

8

但是它如何处理特定语言的排序规则？它会考虑语言环境吗？

不会，list.sort() 是一个通用的排序函数。如果你想按照 Unicode 规则排序，你需要定义一个自定义的排序键函数。你可以尝试使用 pyuca 模块，但我不知道它有多完整。

- John Millikin

2

l =['abc' , 'cd' , 'xy' , 'ba' , 'dc']
l.sort()
print(l)

结果

['abc', 'ba', 'cd', 'dc', 'xy']

- asing177

1

虽然这个问题比较老，但如果你想进行本地化排序而不设置 locale.LC_ALL，你可以按照这个答案的建议使用 PyICU 库来实现：

import icu # PyICU

def sorted_strings(strings, locale=None):
    if locale is None:
       return sorted(strings)
    collator = icu.Collator.createInstance(icu.Locale(locale))
    return sorted(strings, key=collator.getSortKey)

然后使用例如以下方式调用：

new_list = sorted_strings(list_of_strings, "de_DE.utf8")

这对我有效，无需安装任何语言环境或更改其他系统设置。

（上面的评论已经建议了这一点，但我想更加突出它，因为我一开始错过了它。）

- vlz

0

或者也许：

names = ['Jasmine', 'Alberto', 'Ross', 'dig-dog']
print ("The solution for this is about this names being sorted:",sorted(names, key=lambda name:name.lower()))

- Dragos Alexe

0

很简单： https://trinket.io/library/trinkets/5db81676e4

scores = '54 - Alice,35 - Bob,27 - Carol,27 - Chuck,05 - Craig,30 - Dan,27 - Erin,77 - Eve,14 - Fay,20 - Frank,48 - Grace,61 - Heidi,03 - Judy,28 - Mallory,05 - Olivia,44 - Oscar,34 - Peggy,30 - Sybil,82 - Trent,75 - Trudy,92 - Victor,37 - Walter'

scores = scores.split(',') for x in sorted(scores): print(x)

分数 = 分数.split(',') for x in sorted(分数): print(x)

- Hedayatullah Sarwary

网页内容由stack overflow 提供, 点击上面的

可以查看英文原文，
原文链接

- Eli Courtwright · Accepted Answer

基本答案：

mylist = ["b", "C", "A"]
mylist.sort()

这会修改您原始的列表（即就地排序）。要获取已排序的列表副本，而不更改原始列表，请使用sorted()函数：

for x in sorted(mylist):
    print x

然而，以上示例有些幼稚，因为它们没有考虑区域设置，并执行区分大小写的排序。您可以利用可选参数key指定自定义排序顺序（使用cmp的替代方法已被弃用，因为它必须被多次评估，而key仅对每个元素计算一次）。

因此，要根据当前语言环境进行排序并考虑特定于语言的规则（cmp_to_key是functools中的辅助函数）：

sorted(mylist, key=cmp_to_key(locale.strcoll))

最后，如果需要，您可以指定一个自定义区域设置进行排序：

import locale
locale.setlocale(locale.LC_ALL, 'en_US.UTF-8') # vary depending on your lang/locale
assert sorted((u'Ab', u'ad', u'aa'),
  key=cmp_to_key(locale.strcoll)) == [u'aa', u'Ab', u'ad']

最后提醒：你会看到一些不区分大小写排序的例子，使用了lower()方法 - 这些是不正确的，因为它们只适用于ASCII字符集的子集。对于任何非英语数据，这两个都是错误的：

# this is incorrect!
mylist.sort(key=lambda x: x.lower())
# alternative notation, a bit faster, but still wrong
mylist.sort(key=str.lower)