在 Python 中如何将字符串转换为小写?

2521
9个回答

3599

4
如果你没有得到预期的字符串,那么只有使用ASCII字符时才能很好地工作。如果需要,你可以使用"str.maketrans"和"str.translate"来进行转换。 - Ekrem Dinçel
3
不仅适用于ASCII字符,还适用于许多带附加符号的字符,例如ÀÇÐÊĞİŃÓŒŘŠŤÚŻ,但是在无点的i字符“ı”方面存在问题。执行"ı".upper().lower()将变为“i”,而有点的大写“İ”由于带有一个“上加点(0x307)”而保留下来。 - lolesque

425

这个问题的规范Pythonic方式是

>>> 'Kilometers'.lower()
'kilometers'

然而,如果目的是进行不区分大小写的匹配,您应该使用折叠大小写:
>>> 'Kilometers'.casefold()
'kilometers'

这是为什么:
>>> "Maße".casefold()
'masse'
>>> "Maße".lower()
'maße'
>>> "MASSE" == "Maße"
False
>>> "MASSE".lower() == "Maße".lower()
False
>>> "MASSE".casefold() == "Maße".casefold()
True

这是Python 3中的一个字符串方法,但在Python 2中,您需要查看PyICU或py2casefold - 这里有几个答案解决了这个问题

Unicode Python 3

Python 3将普通字符串文字处理为Unicode:

>>> string = 'Километр'
>>> string
'Километр'
>>> string.lower()
'километр'

Python 2中,普通字符串字面量是字节

在Python 2中,下面的内容复制到shell中时,使用utf-8将文字编码为字节字符串。

lower不会映射任何字节感知到的更改,因此我们得到相同的字符串。

>>> string = 'Километр'
>>> string
'\xd0\x9a\xd0\xb8\xd0\xbb\xd0\xbe\xd0\xbc\xd0\xb5\xd1\x82\xd1\x80'
>>> string.lower()
'\xd0\x9a\xd0\xb8\xd0\xbb\xd0\xbe\xd0\xbc\xd0\xb5\xd1\x82\xd1\x80'
>>> print string.lower()
Километр

在脚本中,Python会因为没有给定编码而拒绝非ASCII(自Python 2.5以来,在Python 2.4中警告)字节出现在字符串中,因为意图的编码会是模棱两可的。更多信息请参见文档中的Unicode how-to和PEP 263
使用Unicode字面量而不是str字面量
因此,我们需要一个unicode字符串来处理这个转换,可以使用一个带有u前缀的unicode字符串字面量轻松消除歧义(注意,u前缀在Python 3中也适用)。
>>> unicode_literal = u'Километр'
>>> print(unicode_literal.lower())
километр

请注意,字节与str字节完全不同 - 转义字符为'\u',后跟这些unicode字母的2个字节宽度或16位表示形式。
>>> unicode_literal
u'\u041a\u0438\u043b\u043e\u043c\u0435\u0442\u0440'
>>> unicode_literal.lower()
u'\u043a\u0438\u043b\u043e\u043c\u0435\u0442\u0440'

现在,如果我们只有一个str形式的字符串,我们需要将其转换为unicode。Python的Unicode类型是一种通用编码格式,在与大多数其他编码相比具有许多优势。我们可以使用unicode构造函数或str.decode 方法与编解码器一起将str转换为unicode
>>> unicode_from_string = unicode(string, 'utf-8') # "encoding" unicode from string
>>> print(unicode_from_string.lower())
километр
>>> string_to_unicode = string.decode('utf-8') 
>>> print(string_to_unicode.lower())
километр
>>> unicode_from_string == string_to_unicode == unicode_literal
True

两种方法都会转换为unicode类型,与unicode_literal相同。

最佳实践,使用Unicode

建议您始终使用Unicode处理文本

软件应仅在内部使用Unicode字符串,在输出时转换为特定的编码。

必要时可以进行编码

然而,为了将小写字母返回到str类型,再次将python字符串编码为utf-8

>>> print string
Километр
>>> string
'\xd0\x9a\xd0\xb8\xd0\xbb\xd0\xbe\xd0\xbc\xd0\xb5\xd1\x82\xd1\x80'
>>> string.decode('utf-8')
u'\u041a\u0438\u043b\u043e\u043c\u0435\u0442\u0440'
>>> string.decode('utf-8').lower()
u'\u043a\u0438\u043b\u043e\u043c\u0435\u0442\u0440'
>>> string.decode('utf-8').lower().encode('utf-8')
'\xd0\xba\xd0\xb8\xd0\xbb\xd0\xbe\xd0\xbc\xd0\xb5\xd1\x82\xd1\x80'
>>> print string.decode('utf-8').lower().encode('utf-8')
километр

在Python 2中,Unicode可以编码为Python字符串,Python字符串可以解码为Unicode类型。

我有一个注释,虽然不一定适用于OP的问题,但在可移植性(国际化)方面非常重要,特别是在进行不区分大小写匹配时。在不区分大小写的匹配中,变音符号(重音符号)可能会成为一个问题。例如:>>> "raison d'être".casefold(); "raison d'être"请查看关于unidecode这个答案 - bballdave025

211
在 Python 2 中,这对于 UTF-8 中的非英语单词无法正常工作。在这种情况下,可以使用 decode('utf-8') 来帮助解决问题。
>>> s='Километр'
>>> print s.lower()
Километр
>>> print s.decode('utf-8').lower()
километр

11
也许我们应该更明确地说,在Python 3中,decode('utf-8')不仅是不必要的,而且会导致错误。(参考链接:https://dev59.com/IF4b5IYBdhLWcg3w5VE9)。例如:`$python3; >>>s='Километр'; >>>print (s.lower); #result: километр >>>s.decode('utf-8').lower(); #result: ...AttributeError: 'str' object has no attribute 'decode' 我们可以看到另一种方法,参考@AaronHall的优秀回答。>>>s.casefold() #result: километр` - bballdave025

27

此外,您可以覆盖一些变量:

s = input('UPPER CASE')
lower = s.lower()

如果您使用以下方式:

s = "Kilometer"
print(s.lower())     - kilometer
print(s)             - Kilometer

只有在调用时它才会起作用。


13
如何将字符串转换为小写?这个答案怎么获得了那么多点赞? - Munim Munna
2
s=s.lower() 是正确的方法。 - vossmalte
@m00lti 为什么是s?变量名与问题有什么关系吗? - Ekrem Dinçel
@EkremDinçel 像字符串一样,我想。 - ergo
s 就像它在答案中被使用的那样 - vossmalte

7

不要尝试这个,完全不推荐,不要这样做:

import string
s='ABCD'
print(''.join([string.ascii_lowercase[string.ascii_uppercase.index(i)] for i in s]))

输出:

abcd

由于还没有人写过,您可以使用swapcase(因此大写字母将变为小写字母,反之亦然)(在我刚刚提到的情况下,应该使用这个函数(将大写转换为小写,将小写转换为大写)):

s='ABCD'
print(s.swapcase())

输出:

abcd

1

小写化

这个方法不仅将拉丁字母表中的所有大写字母转换为小写字母,还展示了这种逻辑是如何实现的。您可以在任何在线Python沙盒中测试此代码。

def turnIntoLowercase(string):
    
    lowercaseCharacters = ''
    
    abc = ['a','b','c','d','e','f','g','h','i','j','k','l','m', 
           'n','o','p','q','r','s','t','u','v','w','x','y','z',
           'A','B','C','D','E','F','G','H','I','J','K','L','M',
           'N','O','P','Q','R','S','T','U','V','W','X','Y','Z']
  
    for character in string:
        if character not in abc:
            lowercaseCharacters += character
        elif abc.index(character) <= 25:
            lowercaseCharacters += character
        else: 
            lowercaseCharacters += abc[abc.index(character) - 26]
    return lowercaseCharacters

string = str(input("Enter your string, please: " ))

print(turnIntoLowercase(string = string))

性能检查

现在,让我们输入以下字符串(并按下Enter)以确保一切按预期工作:

# Enter your string, please: 

"PYTHON 3.11.2, 15TH FeB 2023"

结果:

"python 3.11.2, 15th feb 2023"

0

有几种不同的方法可以实现这个。

  1. 使用 .lower() 方法
original_string = "UPPERCASE"
lowercase_string = original_string.lower()
print(lowercase_string)  # Output: "uppercase"

使用str.lower()
original_string = "UPPERCASE"
lowercase_string = str.lower(original_string)
print(lowercase_string)  # Output: "uppercase"

使用 str.translate()str.maketrans() 的组合。
original_string = "UPPERCASE"
lowercase_string = original_string.translate(str.maketrans(string.ascii_uppercase, string.ascii_lowercase))
print(lowercase_string)  # Output: "uppercase"

0
如果您想将字符串列表转换为小写,可以使用map函数和str.lower方法:
list_of_strings = ['CamelCase', 'in', 'Python']
list(map(str.lower, list_of_strings))            # ['camelcase', 'in', 'python']

0

有多种方式将字符串转换为小写。

使用适合自己的方法。

1- .lower()函数。

语法: string.islower()

属性:

  • 无参: .lower()方法不需要参数。
  • 自动检查: 如果在给定的字符串中没有找到大写字符,则返回原始字符串。
  • 忽略除字符串以外的所有内容: 它忽略字符串之间的数字、符号、独特事物等。

示例: (不需要参数)

message = 'I LOVE Python'

# convert message to lowercase
print(message.lower())

输出:

我喜欢Python

示例:(忽略数字)

# example string
string = "THIS SHOULD BE LOWERCASE!"
print(string.lower())

# string with numbers
# all alphabets should be lowercase
string = "Th!s Sh0uLd B3 L0w3rCas3!"
print(string.lower())

这应该是小写字母! 这也应该是小写字母! 独特用法:您可以比较两个字符串。

# first string
firstString = "I AM ALI!"

# second string
secondString = "i aM AlI!"

if(firstString.lower() == secondString.lower()):
    print("The strings are same.")
else:
    print("The strings are not same.")

输出:字符串相同。

2- SwapCase 函数

  • 它将交换整个大小写。

s = 'IAMALI'
print(s.swapcase())

输出:

iamali

3- casefold() 函数

  • 更强的转换能力: casefold() 方法更加强大和积极,这意味着它会将更多的字符转换为小写,并发现更多的匹配。

s = 'IAmAli'
print(s.casefold())

输出:

iamali

希望能帮到你。


str.casefold()方法不会将字符串转为小写,它只是移除大小写区分,并且对于某些文字,字符会被转为大写而不是小写。 - undefined

网页内容由stack overflow 提供, 点击上面的
可以查看英文原文,
原文链接