我希望能够在statsmodels中使用线性LASSO回归,以便使用“公式”符号来编写模型,这将为我在处理许多分类变量及其交互作用时节省大量编码时间。然而,似乎statsmodels尚未实现此功能?
我希望能够在statsmodels中使用线性LASSO回归,以便使用“公式”符号来编写模型,这将为我在处理许多分类变量及其交互作用时节省大量编码时间。然而,似乎statsmodels尚未实现此功能?
可以使用Patsy与scikit-learn一起使用,以获得在statsmodels中使用公式符号所得到的相同结果。请参见以下代码:
from patsy import dmatrices
# create dummy variables, and their interactions
y, X = dmatrices('outcome ~ C(var1)*C(var2)', df, return_type="dataframe")
# flatten y into a 1-D array so scikit-learn can understand it
y = np.ravel(y)
现在我可以使用scikit-learn中实现的任何模型,使用X作为自变量,y作为因变量的通常符号。