得票数最多 'sklearn-pandas' 问题 - 第3页

关联标签

13得票3回答

为什么不应该使用sklearn LabelEncoder来编码输入数据？

sklearn.LabelEncoder的文档开头是这样写的：这个转换器应该被用来编码目标值，即 y，而不是输入的 X。为什么会这样呢？我只举一个忽略了这条建议的例子，但似乎还有很多类似的情况。 https://www.kaggle.com/matleonard/featu...

pythonsklearn-pandasfeature-engineering

13得票4回答

功能名称必须唯一 - Xgboost

我正在为一个非常稀疏的矩阵运行xgboost模型。我遇到了这个错误。ValueError：feature_names必须是唯一的我该如何处理？这是我的代码。 yprob = bst.predict(xgb.DMatrix(test_df))[:,1]

pythonpandasxgboostsklearn-pandas

12得票3回答

如何使用随机森林标记特征重要性？

我使用sklearn来绘制树林的特征重要性。数据帧的名称为“心脏”。以下是提取排序特征列表的代码：importances = extc.feature_importances_ indices = np.argsort(importances)[::-1] print("Feature ran...

pythonnumpymatplotlibscikit-learnsklearn-pandas

12得票4回答

如何在Python Pandas数据框中标准化某些列？

以下Python代码仅返回一个数组，但我希望使用缩放后的数据替换原始数据。from sklearn.preprocessing import StandardScaler df = StandardScaler().fit_transform(df[['cost', 'sales']]) df...

pythonpandassklearn-pandasstandardized

12得票3回答

Sklearn错误：predict（x，y）需要2个位置参数，但提供了3个

我正在使用sklearn构建多元回归分析，我已经仔细阅读了文档。当我运行predict()函数时，出现错误：predict()需要2个位置参数，但给出了3个。 X是一个数据框，y是一列; 我尝试将数据框转换为数组/矩阵，但仍然出现错误。添加了一个代码片段，显示x和y数组。reg.coef...

scikit-learnsklearn-pandas

12得票1回答

sklearn Pipeline和DataFrameMapper有什么区别？

Sklearn Pipeline： http://scikit-learn.org/stable/modules/generated/sklearn.pipeline.Pipeline.html DataFrameMapper: https://github.com/paulgb/sklea...

scikit-learnpipelinesklearn-pandas

11得票3回答

sklearn.linear_model.ridge中的统计摘要表是什么？

在OLS形式的StatsModels中，results.summary显示回归结果的摘要（例如AIC，BIC，R-squared等）。是否有办法在sklearn.linear_model.ridge中获得此摘要表格？如果有人可以指导我，我将不胜感激。谢谢。

pythonstatsmodelssklearn-pandas

11得票2回答

将数组附加到数据框中（Python）

我在一个小的销售数据集上运行了时间序列模型，并预测了未来12个周期的销售。使用以下代码： mod1=ARIMA(df1, order=(2,1,1)).fit(disp=0,transparams=True) y_future=mod1.forecast(steps=12)[0] df...

pythonarrayspandasdataframesklearn-pandas

11得票4回答

GridSearchCV: "TypeError: 'StratifiedKFold' object is not iterable" 网格搜索交叉验证： "TypeError: 'StratifiedKFold'对象不可迭代"

我想在一个RandomForestClassifier中执行GridSearchCV，但是数据不平衡，所以我使用了StratifiedKFold：from sklearn.model_selection import StratifiedKFold from sklearn.grid_sear...

pandasscikit-learngrid-searchsklearn-pandas

11得票3回答

Sklearn SVM：SVR和SVC，每个输入都得到相同的预测

这是代码的粘贴：SVM示例代码我看了一些其他问题的答案...而且似乎这个问题的特定迭代有点不同。首先，我的输入已经归一化，并且每个点都有五个输入。这些值都是适度大小的（例如健康的0.5和0.7等等），很少有接近零或接近1的数字。我有大约70个x输入对应于它们的70个y输入。 y输入...

pythonscikit-learnsklearn-pandas