13得票3回答
为什么不应该使用sklearn LabelEncoder来编码输入数据?

sklearn.LabelEncoder的文档开头是这样写的: 这个转换器应该被用来编码目标值,即 y,而不是输入的 X。 为什么会这样呢? 我只举一个忽略了这条建议的例子,但似乎还有很多类似的情况。 https://www.kaggle.com/matleonard/featu...

13得票4回答
功能名称必须唯一 - Xgboost

我正在为一个非常稀疏的矩阵运行xgboost模型。 我遇到了这个错误。ValueError:feature_names必须是唯一的 我该如何处理? 这是我的代码。 yprob = bst.predict(xgb.DMatrix(test_df))[:,1]

12得票3回答
如何使用随机森林标记特征重要性?

我使用sklearn来绘制树林的特征重要性。数据帧的名称为“心脏”。以下是提取排序特征列表的代码:importances = extc.feature_importances_ indices = np.argsort(importances)[::-1] print("Feature ran...

12得票4回答
如何在Python Pandas数据框中标准化某些列?

以下Python代码仅返回一个数组,但我希望使用缩放后的数据替换原始数据。from sklearn.preprocessing import StandardScaler df = StandardScaler().fit_transform(df[['cost', 'sales']]) df...

12得票3回答
Sklearn错误:predict(x,y)需要2个位置参数,但提供了3个

我正在使用sklearn构建多元回归分析,我已经仔细阅读了文档。当我运行predict()函数时,出现错误:predict()需要2个位置参数,但给出了3个。 X是一个数据框,y是一列; 我尝试将数据框转换为数组/矩阵,但仍然出现错误。 添加了一个代码片段,显示x和y数组。reg.coef...

12得票1回答
sklearn Pipeline和DataFrameMapper有什么区别?

Sklearn Pipeline: http://scikit-learn.org/stable/modules/generated/sklearn.pipeline.Pipeline.html DataFrameMapper: https://github.com/paulgb/sklea...

11得票3回答
sklearn.linear_model.ridge中的统计摘要表是什么?

在OLS形式的StatsModels中,results.summary显示回归结果的摘要(例如AIC,BIC,R-squared等)。 是否有办法在sklearn.linear_model.ridge中获得此摘要表格? 如果有人可以指导我,我将不胜感激。谢谢。

11得票2回答
将数组附加到数据框中(Python)

我在一个小的销售数据集上运行了时间序列模型,并预测了未来12个周期的销售。使用以下代码: mod1=ARIMA(df1, order=(2,1,1)).fit(disp=0,transparams=True) y_future=mod1.forecast(steps=12)[0] df...

11得票4回答
GridSearchCV: "TypeError: 'StratifiedKFold' object is not iterable" 网格搜索交叉验证: "TypeError: 'StratifiedKFold'对象不可迭代"

我想在一个RandomForestClassifier中执行GridSearchCV,但是数据不平衡,所以我使用了StratifiedKFold:from sklearn.model_selection import StratifiedKFold from sklearn.grid_sear...

11得票3回答
Sklearn SVM:SVR和SVC,每个输入都得到相同的预测

这是代码的粘贴:SVM示例代码 我看了一些其他问题的答案...而且似乎这个问题的特定迭代有点不同。 首先,我的输入已经归一化,并且每个点都有五个输入。这些值都是适度大小的(例如健康的0.5和0.7等等),很少有接近零或接近1的数字。 我有大约70个x输入对应于它们的70个y输入。 y输入...