将由'bs'或'ns'构建的拟合回归样条导出为分段多项式。

6
例如以下一节,度数为2的一次样条曲线:
library(splines)
library(ISLR)
fit.spline <- lm(wage~bs(age, knots=c(42), degree=2), data=Wage)
summary(fit.spline)

我看到了一些出乎我的意料的估算。

Coefficients:
                                  Estimate  Std. Error   t value    Pr(>|t|)   
(Intercept)                           57.349   3.950   14.518   < 2e-16 ***
bs(age, knots = c(42), degree = 2)1   59.511   5.786   10.285   < 2e-16 ***
bs(age, knots = c(42), degree = 2)2   65.722   4.076   16.122   < 2e-16 ***
bs(age, knots = c(42), degree = 2)3   37.170   9.722    3.823  0.000134 ***

有没有一种方法可以提取节点之前和之后的二次模型(以及其系数)? 也就是说,如何提取age = 42切点之前和之后的两个二次模型?

使用summary(fit.spline)可以得到系数,但是(据我所知),它们对于解释并不具有意义。

1个回答

14

我的原始回答中不断被要求将想法整合成一个用户友好的函数,能够使用bsns项重新参数化拟合的线性或广义线性模型。最终,我推出了一个小型的R包SplinesUtils,网址在https://github.com/ZheyuanLi/SplinesUtils(附有PDF版本的手册)。您可以通过以下方式安装它:

## make sure you have the `devtools` package avaiable
devtools::install_github("ZheyuanLi/SplinesUtils")

这里要使用的函数是RegBsplineAsPiecePoly

library(SplinesUtils)

library(splines)
library(ISLR)
fit.spline <- lm(wage ~ bs(age, knots=c(42), degree=2), data = Wage)

ans1 <- RegBsplineAsPiecePoly(fit.spline, "bs(age, knots = c(42), degree = 2)")
ans1
#2 piecewise polynomials of degree 2 are constructed!
#Use 'summary' to export all of them.
#The first 2 are printed below.
#8.2e-15 + 4.96 * (x - 18) + 0.0991 * (x - 18) ^ 2
#61.9 + 0.2 * (x - 42) + 0.0224 * (x - 42) ^ 2

## coefficients as a matrix
ans1$PiecePoly$coef
#              [,1]        [,2]
#[1,]  8.204641e-15 61.91542748
#[2,]  4.959286e+00  0.20033307
#[3,] -9.914485e-02 -0.02240887

## knots
ans1$knots
#[1] 18 42 80

该函数默认对分段多项式进行参数化(参见?PiecePoly)以进行平移。您可以设置shift = FALSE来获得非平移版本。

ans2 <- RegBsplineAsPiecePoly(fit.spline, "bs(age, knots = c(42), degree = 2)",
                              shift = FALSE)
ans2
#2 piecewise polynomials of degree 2 are constructed!
#Use 'summary' to export all of them.
#The first 2 are printed below.
#-121 + 8.53 * x + 0.0991 * x ^ 2
#14 + 2.08 * x + 0.0224 * x ^ 2

## coefficients as a matrix
ans2$PiecePoly$coef
#              [,1]        [,2]
#[1,] -121.39007747 13.97219046
#[2,]    8.52850050  2.08267822
#[3,]   -0.09914485 -0.02240887

你可以使用 predict 来预测样条曲线。

xg <- 18:80
yg1 <- predict(ans1, xg)  ## use shifted form
yg2 <- predict(ans2, xg)  ## use non-shifted form
all.equal(yg1, yg2)
#[1] TRUE

但是由于模型中存在一个截距,预测值将与模型预测值有所不同。

yh <- predict(fit.spline, data.frame(age = xg))
intercept <- coef(fit.spline)[[1]]
all.equal(yh, yg1 + intercept, check.attributes = FALSE)
#[1] TRUE

该包中有“PiecePoly”类的summaryprintplotpredictsolve方法。探索该包以获得更多信息。


网页内容由stack overflow 提供, 点击上面的
可以查看英文原文,
原文链接