在Python中计算非线性曲线拟合的决定系数(R2)和均方根误差(RMSE)。

3

如何在Python中计算非线性曲线拟合的决定系数(R2)和均方根误差(RMSE)。以下代码完成了曲线拟合。接下来如何计算R2和RMSE?

import numpy as np
import matplotlib.pyplot as plt
from scipy.optimize import curve_fit

def func(x, a, b, c):
    return a * np.exp(-b * x) + c

x = np.linspace(0,4,50)
y = func(x, 2.5, 1.3, 0.5)
yn = y + 0.2*np.random.normal(size=len(x))

popt, pcov = curve_fit(func, x, yn)

plt.figure()
plt.plot(x, yn, 'ko', label="Original Noised Data")
plt.plot(x, func(x, *popt), 'r-', label="Fitted Curve")
plt.legend()
plt.show()

根据statsmodels开发人员的帖子scipy.stats.linregress中的std_err实际上是斜率系数误差。这个值与RMSE不同,RMSE是(平方残差的平均值)^0.5,是一个随着自由度而变化的不同值。 - pylang
不,scipy文档中写道SE是估计的标准误差。http://docs.scipy.org/doc/scipy/reference/generated/scipy.stats.linregress.html#scipy.stats.linregress - Borys
在我提供的链接中,你给出的scipy文档的作者解释了这个定义。他的帖子证实了scipy的SE是斜率误差。 - pylang
从sklearn.metrics导入r2_score。 - daruma
2个回答

5
你可以像这样做:

您可以这样做:

print "Mean Squared Error: ", np.mean((y-func(x, *popt))**2)

ss_res = np.dot((yn - func(x, *popt)),(yn - func(x, *popt)))
ymean = np.mean(yn)
ss_tot = np.dot((yn-ymean),(yn-ymean))
print "Mean R :",  1-ss_res/ss_tot

这是直接采用定义的方式,例如在维基百科中: http://en.wikipedia.org/wiki/Coefficient_of_determination#Definitions

快速更正:根据您提供的维基百科页面,您给出的“Mean R”值实际上是R ^ 2。 - Nathan Lloyd

0

马丁·伯申,这里不是y而是yn

np.mean((y-func(x, *popt))**2)

关于均方根误差(RMSE)的内容,请参阅:http://en.wikipedia.org/wiki/Regression_analysis

residuals = yn - func(x,*popt)
print "RMSE",(scipy.sum(residuals**2)/(residuals.size-2))**0.5

现在它计算方式与Excel 2003的Analysis ToolPak相同。


网页内容由stack overflow 提供, 点击上面的
可以查看英文原文,
原文链接