我正在使用相当简单的SQL代码,使用最小二乘法计算回归系数(截距和斜率)来计算一些(x,y)数据点的最佳拟合直线。这为我提供了一条漂亮的最佳拟合线通过数据。然而,我们希望能够看到最佳拟合线(下面的曲线)的95%和5%置信区间。
(来源:curvefit.com) 这意味着真实的线有95%的概率在上限曲线下方,并且有95%的概率在下限曲线上方。我如何计算这些曲线?我已经阅读了维基百科等,并进行了一些谷歌搜索,但我没有找到可理解的数学方程式来计算这个。
(来源:curvefit.com) 这意味着真实的线有95%的概率在上限曲线下方,并且有95%的概率在下限曲线上方。我如何计算这些曲线?我已经阅读了维基百科等,并进行了一些谷歌搜索,但我没有找到可理解的数学方程式来计算这个。
--sample data
create table #lr (x real not null, y real not null)
insert into #lr values (0,1)
insert into #lr values (4,9)
insert into #lr values (2,5)
insert into #lr values (3,7)
declare @slope real
declare @intercept real
--calculate slope and intercept
select
@slope = ((count(*) * sum(x*y)) - (sum(x)*sum(y)))/
((count(*) * sum(Power(x,2)))-Power(Sum(x),2)),
@intercept = avg(y) - ((count(*) * sum(x*y)) - (sum(x)*sum(y)))/
((count(*) * sum(Power(x,2)))-Power(Sum(x),2)) * avg(x)
from #lr
提前感谢你。