如何使用Matplotlib创建一个基于分类数据的饼图?

9

我有以下数据:

ID  Gender  Country  ...
1   Male    UK
2   Female  US
3   Male    NZ
4   Female  UK
...

性别只有两个选项,国家只有三个选项。我想为“性别”和“国家”创建单独的饼状图,以显示数据中每个选项出现的次数,但对于如何实现我感到很困惑。

数据存储在Pandas数据帧中。

非常感谢任何和所有的帮助!


你的数据使用了哪种数据结构? - Nils
它被存储在一个Pandas数据框中。 - Manesh Halai
3个回答

12

这里是使用 pandas 的一种方法:

import pandas as pd
import numpy as np
from matplotlib import pyplot as plt

def label_function(val):
    return f'{val / 100 * len(df):.0f}\n{val:.0f}%'

N = 50
df = pd.DataFrame({'country': np.random.choice(['UK', 'US', 'NZ'], N),
                   'gender': np.random.choice(['Male', 'Female'], N)})

fig, (ax1, ax2) = plt.subplots(ncols=2, figsize=(10, 5))

df.groupby('country').size().plot(kind='pie', autopct=label_function, textprops={'fontsize': 20},
                                  colors=['tomato', 'gold', 'skyblue'], ax=ax1)
df.groupby('gender').size().plot(kind='pie', autopct=label_function, textprops={'fontsize': 20},
                                 colors=['violet', 'lime'], ax=ax2)
ax1.set_ylabel('Per country', size=22)
ax2.set_ylabel('Per gender', size=22)plt.tight_layout()
plt.show()

示例图

提示:若只想显示百分比,请使用autopct='%1.0f%%'


太好了,谢谢!有没有办法在图表上添加数据标签,以便它们也显示图表上的金额/百分比? - Manesh Halai

7

我假设你已经开始了这个过程

import pandas as pd
from matplotlib.pyplot import pie, axis, show

df = pd.DataFrame([[1,'Male','UK'],   [2, 'Female', 'NZ'],    [3, 'Male', 'UK'], [4, 'Male', 'US']], columns=['ID',  'Gender',  'Country'])

性别数据的图表

df.groupby('gender').size().plot(kind='pie', autopct='%.2f')

在此输入图像描述

国家的情节

df.groupby('country').size().plot(kind='pie', autopct='%.2f')

enter image description here


4

好的,既然你正在使用这样的数据框:

data = pd.DataFrame([[1,'Male','UK'],   [2, 'Female', 'NZ'],    [3, 'Male', 'UK'], [4, 'Male', 'US']], columns=['ID',  'Gender',  'Country'])

你可以简单地这样做:
data['Gender'].value_counts().plot(kind='pie')

如果您想手动完成:

people = len(data.Gender)
genders = len(set(data.Gender))

res = []
for gender in set(data.Gender):
    res.append([gender, len(data[data['Gender']==gender]), len(data[data['Gender']==gender])/people])

然后仅需绘制它。


太好了,谢谢!有没有办法在图表上添加数据标签,以便它们也显示图表上的金额/百分比? - Manesh Halai

网页内容由stack overflow 提供, 点击上面的
可以查看英文原文,
原文链接