16得票1回答
使用平滑器和L方法确定K-Means聚类的数量

有人尝试在应用L方法确定数据集中k-means簇数之前,将平滑器应用于评估指标吗?如果是这样,结果是否得到了改善?或者允许更少的k-means试验,从而大大增加速度?您使用了哪种平滑算法/方法? L方法详见:确定分层聚类/分割算法中簇/段数的方法,Salvador & Chan 该...

16得票3回答
如何在Statsmodels中进行鲁棒回归(RLM)并得到R平方值?

谈到拟合优度的衡量 - R-Squared 似乎是“简单”线性模型常用(并且被接受)的一种度量方式。 但是在 statsmodels (以及其他统计软件)中,RLM 并没有包括 R-squared 与回归结果。 是否有一种“手动”计算的方法,可以类似于 Stata 中的方法? 或者是否有另一种...

15得票2回答
使用statsmodels的OLS模型预测数值

我使用OLS(多元线性回归)计算了一个模型。我将数据分为训练集和测试集(各一半),然后我想预测标签的后一半的值。 model = OLS(labels[:half], data[:half]) predictions = model.predict(data[half:]) 问题在于我收...

15得票2回答
在Python中如何轻松访问标准化残差、Cook's值、帽子值(杠杆)等内容?

我正在寻找线性回归配适后的影响统计量。在R中,我可以像这样获得它们:hatvalues(fitted_model) #hatvalues (leverage) cooks.distance(fitted_model) #Cook's D values rstandard(fitted_mode...

15得票4回答
预测与实际绘图

我对R编程和统计学还很陌生,不知道如何在进行多元线性回归后绘制预测值与实际值的图形。我曾看到过类似的问题(但是无法理解代码),如果您能够帮忙解释代码,我将非常感激。# Attach file containing variables and responses q <- read.csv...

15得票1回答
在Python中使用sklearn线性回归得到置信区间

我想获得一次线性回归结果的置信区间。我正在使用波士顿房价数据集。 我找到了这个问题:如何在python中计算线性回归模型斜率的99%置信区间?,但是这并不能完全回答我的问题。 这是我的代码: import numpy as np import matplotlib.pyplot as p...

15得票2回答
矩阵未对齐错误:Python SciPy fmin_bfgs

问题概述: 在尝试使用scipy.optimize.fmin_bfgs最小化(优化)函数时,该函数会抛出错误 derphi0 = np.dot(gfk, pk) ValueError: 矩阵未对齐 根据我的错误检查,这发生在第一次迭代fmin_bfgs的最后,在返回任何值或调用回...

15得票1回答
如何从线性模型输出中获取RSS

以下是一个包含一个响应变量和三个解释变量的数据集的线性模型输出。如何获得原始回归的RSS? Call: lm(formula = y ~ x1 + x2 + x3) Residuals: Min 1Q Median 3Q Max -4.9...

14得票3回答
如何在R中使用公式排除主效应但保留交互作用。

我不需要主效应,因为它与一个更细的因素固定效应共线,所以出现这些 NA 很烦人。在这个例子中:lm(y ~ x * z) 我希望得到x(数值型)和z(因子型)之间的交互作用,但不要得到z的主效应。

14得票3回答
统计模型中使用的OLS:statsmodel.formula.api 和 statsmodel.api 的区别

有人能解释一下statsmodel.formula.api中的ols与statsmodel.api中的ols之间的区别吗?我使用ISLR文本中的广告数据运行了两者的ols,并得到了不同的结果。接着我将其与scikit-learn的LinearRegression进行了比较。import num...