如何在散点图中添加趋势线

79

我如何在使用matplotlib.scatter绘制的点图中添加趋势线?


1
这个问题展示了如何计算趋势线,然后绘制它。 - aquavitae
2个回答

105

这里所解释的那样。

借助于numpy,可以计算出例如线性拟合等内容。

# plot the data itself
pylab.plot(x,y,'o')

# calc the trendline
z = numpy.polyfit(x, y, 1)
p = numpy.poly1d(z)
pylab.plot(x,p(x),"r--")
# the line equation:
print "y=%.6fx+(%.6f)"%(z[0],z[1])

4
z = numpy.polynomial.polynomial.polyfit(x, y, 1) 更加数值稳定。 - Gulzar
2
np.polynomial.polynomial.polyfit 在我尝试时表现得非常糟糕。不过 polyfit 表现良好。 - Charlie Crown

1

散点图的趋势线是简单回归线。 seaborn 库有一个函数 (regplot),可以在一个函数调用中完成。您甚至可以绘制置信区间(使用 ci=;我在下面的图中将其关闭了)。

import seaborn as sns
sns.regplot(x=x_data, y=y_data, ci=False, line_kws={'color':'red'});

上述调用针对以下数据集生成了以下图表:

import numpy as np
x_data, y_data = np.repeat(np.linspace(0, 9, 100)[None,:], 2, axis=0) + np.random.rand(2, 100)*2

res

如果您使用子图,也可以传递ax=

import matplotlib.pyplot as plt
fig, axs = plt.subplots(1,2, figsize=(12,3))
axs[0].scatter(x_data, y_data)
sns.regplot(x=x_data, y=y_data, ci=False, line_kws={'color':'red'}, ax=axs[1]);

res2


简单回归系数有一个封闭形式的解,因此您也可以明确地解决它们,并将回归线与散点图一起绘制。

如果 x_datay_data 是列表:

x_mean = sum(x_data) / len(x_data)
y_mean = sum(y_data) / len(y_data)
covar = sum((xi - x_mean) * (yi - y_mean) for xi, yi in zip(x_data, y_data))
x_var = sum((xi - x_mean)**2 for xi in x_data)
beta = covar / x_var
alpha = y_mean - beta * x_mean
y_hat = [alpha + beta * xi for xi in x_data]

如果 x_datay_data 是 numpy 数组:
x_mean, y_mean = np.mean(x_data), np.mean(y_data)
beta = np.sum((x_data - x_mean) * (y_data - y_mean)) / np.sum((x_data - x_mean)**2)
alpha = y_mean - beta * x_mean
y_hat = alpha + beta * x_data

然后只需绘制这两个图:

import matplotlib.pyplot as plt
plt.plot(x_data, y_data, 'bo', x_data, y_hat, "r-");

网页内容由stack overflow 提供, 点击上面的
可以查看英文原文,
原文链接