在SQL中进行线性回归置信区间计算

7
我正在使用相当简单的SQL代码,使用最小二乘法计算回归系数(截距和斜率)来计算一些(x,y)数据点的最佳拟合直线。这为我提供了一条漂亮的最佳拟合线通过数据。然而,我们希望能够看到最佳拟合线(下面的曲线)的95%和5%置信区间。
(来源:curvefit.com) 这意味着真实的线有95%的概率在上限曲线下方,并且有95%的概率在下限曲线上方。我如何计算这些曲线?我已经阅读了维基百科等,并进行了一些谷歌搜索,但我没有找到可理解的数学方程式来计算这个。
--sample data
create table #lr (x real not null, y real not null)
insert into #lr values (0,1)
insert into #lr values (4,9)
insert into #lr values (2,5)
insert into #lr values (3,7)

declare @slope real
declare @intercept real

--calculate slope and intercept
select 
@slope = ((count(*) * sum(x*y)) - (sum(x)*sum(y)))/
((count(*) * sum(Power(x,2)))-Power(Sum(x),2)),
@intercept = avg(y) - ((count(*) * sum(x*y)) - (sum(x)*sum(y)))/
((count(*) * sum(Power(x,2)))-Power(Sum(x),2)) * avg(x)
from #lr

提前感谢你。

3个回答

1

0

是这样的!不过我没有任何记忆。抱歉。 - PowerUser

0

@PowerUser:他需要使用双变量设置的方程,而不是单变量设置的方程。

Matt:如果我有我的旧统计教科书,我就能告诉你想要的内容;不幸的是,我没有带来它,也没有我高中统计课程的笔记。另一方面,从我记得的内容来看,它可能只有关于回归线斜率置信区间的内容...

无论如何,这个页面希望对您有所帮助:http://www.stat.yale.edu/Courses/1997-98/101/linregin.htm


网页内容由stack overflow 提供, 点击上面的
可以查看英文原文,
原文链接