在文本文件中统计每个汉字出现的次数

Question

在文本文件中统计每个汉字出现的次数

pythontextcharacter

3

我正在尝试快速学习中文。一个很好的工具是在阅读出现汉字的文本之前先学习每个汉字。

我想要一个函数，它可以读取一个文本文件，识别每个汉字并按出现次数分类。

当涉及到编程时，我完全是个新手，但我准备用Python或任何我能快速学习的语言尝试一下。

例如，输入：

我妹妹现在在北京

输出：

在 - 2
妹 - 2
我 - 1
现 - 1
北 - 1
京 - 1

作为提醒，汉字数量超过4万个，但每天使用的5000个已足够。

- Ben

1个回答

网页内容由stack overflow 提供, 点击上面的

可以查看英文原文，
原文链接

- Padraic Cunningham · Accepted Answer

使用Python3：

from collections import Counter

print(Counter(open("test.txt").read()))
Counter({'妹': 2, '在': 2, '现': 1, '京': 1, '我': 1, ' ': 1, '北': 1}

如果使用 Python 2，请使用 io.open：

from io import open
print(Counter(open("test.txt").read()))
Counter({u'\u5728': 2, u'\u59b9': 2, u' ': 1, u'\u4eac': 1, u'\u6211': 1, u'\u73b0': 1, u'\u5317': 1})