如何统计字符串中某个字符出现的次数?
例如,在字符串“Mary had a little lamb”中,“a”出现了4次。
str.count(sub[, start[, end]])
返回字符串中在区间
[start, end]
中非重叠出现的子字符串sub
的数量。可选参数start
和end
的解释方式与切片相同。
>>> sentence = 'Mary had a little lamb'
>>> sentence.count('a')
4
sentence.lower().count('a')
来消除大小写敏感性。 - RufusVS要获取所有字母的计数,请使用collections.Counter
:
>>> from collections import Counter
>>> counter = Counter("Mary had a little lamb")
>>> counter['a']
4
也许需要用正则表达式?
import re
my_string = "Mary had a little lamb"
len(re.findall("a", my_string))
len(re.findall('1',bin(10)))
。 - Conorbin(10).count('1')
? - Brian\n\n
以区分段落,并且使用len(re.findall(r"(\n){2,}", x))
非常有效。 - abkPython-3.x:
"aabc".count("a")
str.count(sub[, start[, end]])
统计字符串中从指定起始位置到结束位置之间(包括起始位置但不包括结束位置)子串 sub 的不重叠出现次数。可选参数 start 和 end 的解释与切片表示法相同。
str.count(a)
是在字符串中计算单个字符数量的最佳解决方案。但如果您需要计算更多的字符,您需要将整个字符串读取多次,次数与您想要计算的字符数量相同。
这项工作的更好方法是:
from collections import defaultdict
text = 'Mary had a little lamb'
chars = defaultdict(int)
for char in text:
chars[char] += 1
所以你将拥有一个字典,它返回字符串中每个字母出现的次数,如果不存在,则为0
。
>>>chars['a']
4
>>>chars['x']
0
为实现不区分大小写的计数器,您可以通过继承defaultdict
(基类的方法只读)并覆盖其修改器和访问器方法来实现:class CICounter(defaultdict):
def __getitem__(self, k):
return super().__getitem__(k.lower())
def __setitem__(self, k, v):
super().__setitem__(k.lower(), v)
chars = CICounter(int)
for char in text:
chars[char] += 1
>>>chars['a']
4
>>>chars['M']
2
>>>chars['x']
0
Counter
,而这已经是collections
中的一个类了。 - mervCounter
是一个更加臃肿的纯 Python 类,而 defaultdict
的 __missing__
方法是用 C 写的。对于像这样简单的任务(int
也是用 C 实现的),这种方法略微更快一些。 - Nuno Andrénp.unique(sample, return_counts=True)
可能会有用。 - TopCoder2000def check_freq(x):
freq = {}
for c in set(x):
freq[c] = x.count(c)
return freq
check_freq("abbabcbdbabdbdbabababcbcbab")
{'a': 7, 'b': 14, 'c': 3, 'd': 3}
def check_freq(x):
return {c: x.count(c) for c in set(x)}
如果你想要不区分大小写的匹配(当然还有所有正则表达式的强大功能),那么正则表达式非常有用。
my_string = "Mary had a little lamb"
# simplest solution, using count, is case-sensitive
my_string.count("m") # yields 1
import re
# case-sensitive with regex
len(re.findall("m", my_string))
# three ways to get case insensitivity - all yield 2
len(re.findall("(?i)m", my_string))
len(re.findall("m|M", my_string))
len(re.findall(re.compile("m",re.IGNORECASE), my_string))
请注意,正则表达式版本的运行时间大约需要原始版本的十倍,这可能只会在my_string非常长或代码位于深层循环中时成为问题。
a = 'have a nice day'
symbol = 'abcdefghijklmnopqrstuvwxyz'
for key in symbol:
print(key, a.count(key))