29得票2回答
如何持久化Patsy的DesignInfo?

我正在开发一个名为“预测模型即服务”的应用程序,其结构如下: 离线训练模型 定期将模型参数上传到“预测服务器” 预测服务器将单个观察值作为输入,并输出预测结果 我试图使用patsy,但遇到了以下问题:当收到单个预测时,我如何将其转换为正确的形状,使其看起来像训练数据中的一行? 当训练...

18得票3回答
Python: 如何在StatsModels中评估残差?

我想评估残差: (y-hat y)。 我知道如何做:df = pd.read_csv('myFile', delim_whitespace = True, header = None) df.columns = ['column1', 'column2'] y, X = ps.dmatric...

8得票2回答
Patsy:测试数据中分类字段的新水平

我尝试使用Patsy(与sklearn、pandas一起)创建一个简单的回归模型。R风格的公式创作是一个主要吸引点。 我的数据包含一个名为“ship_city”的字段,可以有来自印度的任何城市。由于我将数据分成训练集和测试集,有些城市只出现在其中一个集合中。以下是代码片段: df_trai...

7得票1回答
使用statsmodels.formula.api中的OLS - 如何去除常数项?

我正在跟随statsmodels教程中的第一个示例:http://statsmodels.sourceforge.net/devel/。 我如何在ols中指定不使用常数项进行线性拟合? # Fit regression model (using the natural log of one...

7得票1回答
PatsyError:数据参数和列之间的行数不匹配(statsmodels)

我正在使用Patsy包,使用R风格的公式来处理statsmodels,并收到一个错误消息,但我无法理解其中的原因,请问有什么技巧或提示可以帮助我吗? PatsyError:数据参数和C('Industry_Banking&CapitalMarkets')之间的行数不匹配(8137与...