如何在Seaborn的displot上画出正态分布曲线

4

distplot已被弃用,建议使用displot。

以前的函数有绘制正态曲线的选项。

import seaborn as sns
import matplotlib.pyplot as plt
from scipy import stats

ax = sns.distplot(df.extracted, bins=40, kde=False, fit=stats.norm)

fit=stats.norm不再适用于displot。在回答这个问题时,我看到了一种方法来绘制正态分布曲线,但是它是基于围绕0平均的一些随机数据完成的。

2个回答

4

单一方面

  • .map 可以被使用
import pandas as pd
import seaborn as sns
import numpy as np
import scipy

# data
np.random.seed(365)
x1 = np.random.normal(10, 3.4, size=1000)  # mean of 10
df = pd.DataFrame({'x1': x1})

# display(df.head(3))
          x1
0  10.570932
1  11.779918
2  12.779077

# function for mapping the pdf
def map_pdf(x, **kwargs):
    mu, std = scipy.stats.norm.fit(x)
    x0, x1 = p1.axes[0][0].get_xlim()  # axes for p1 is required to determine x_pdf
    x_pdf = np.linspace(x0, x1, 100)
    y_pdf = scipy.stats.norm.pdf(x_pdf, mu, std)
    plt.plot(x_pdf, y_pdf, c='r')


p1 = sns.displot(data=df, x='x1', kind='hist', bins=40, stat='density')
p1.map(map_pdf, 'x1')

enter image description here

单个或多个维度

  • 更容易通过每个轴迭代并添加PDF文档。
# data
np.random.seed(365)
x1 = np.random.normal(10, 3.4, size=1000)  # mean of 10
x2 = np.random.standard_normal(1000)  # mean of 0
df = pd.DataFrame({'x1': x1, 'x2': x2}).melt()  # create long dataframe

# display(df.head(3))
  variable      value
0       x1  10.570932
1       x1  11.779918
2       x1  12.779077

p1 = sns.displot(data=df, x='value', col='variable', kind='hist', bins=40, stat='density', common_bins=False,
                 common_norm=False, facet_kws={'sharey': True, 'sharex': False})

# extract and flatten the axes from the figure
axes = p1.axes.ravel()

# iterate through each axes
for ax in axes:
    # extract the variable name
    var = ax.get_title().split(' = ')[1]
    
    # select the data for the variable
    data = df[df.variable.eq(var)]
    
    mu, std = scipy.stats.norm.fit(data['value'])
    x0, x1 = ax.get_xlim()
    x_pdf = np.linspace(x0, x1, 100)
    y_pdf = scipy.stats.norm.pdf(x_pdf, mu, std)
    ax.plot(x_pdf, y_pdf, c='r')

enter image description here


3

如果您想复制与您的distplot相同的图形,我建议使用histplot。将我们的数据拟合到正态分布只需要一行代码。

import numpy as np
from scipy import stats
import seaborn as sns

x = np.random.normal(10, 3.4, size=1000)

ax = sns.histplot(x, bins=40, stat='density')

mu, std = stats.norm.fit(x)
xx = np.linspace(*ax.get_xlim(),100)
ax.plot(xx, stats.norm.pdf(xx, mu, std));

输出

拟合高斯分布的直方图


网页内容由stack overflow 提供, 点击上面的
可以查看英文原文,
原文链接