使用 **kwargs 设置 n_estimators 参数（Scikit Learn）

Question

使用 **kwargs 设置 n_estimators 参数（Scikit Learn）

3

我正在尝试按照这个教程学习基于机器学习的预测，但我有两个问题：

问题1：如何设置下面代码中的n_estimators，否则它将始终假定默认值。

from sklearn.cross_validation import KFold

def run_cv(X,y,clf_class,**kwargs):
# Construct a kfolds object
kf = KFold(len(y),n_folds=5,shuffle=True)
y_pred = y.copy()

# Iterate through folds
for train_index, test_index in kf:
    X_train, X_test = X[train_index], X[test_index]
    y_train = y[train_index]
    # Initialize a classifier with key word arguments
    clf = clf_class(**kwargs)
    clf.fit(X_train,y_train)
    y_pred[test_index] = clf.predict(X_test)
return y_pred

这被称为:

从sklearn.svm导入SVC print“％.3f”％accuracy（y，run_cv（X，y，SVC））

问题2：如何使用已经训练好的模型文件（例如从SVM获得）来预测更多未用于训练的（测试）数据？

- user3402601

1个回答

网页内容由stack overflow 提供, 点击上面的

可以查看英文原文，
原文链接

- maxymoo · Accepted Answer

对于你的第一个问题，在上面的代码中，你应该调用run_cv(X,y,SVC,n_classifiers=100)，**kwargs将传递给分类器初始化器，并使用步骤clf = clf_class(**kwargs)。

对于你的第二个问题，在你所链接的代码中，交叉验证只是用于模型评估，即比较不同类型的模型和超参数，并确定你的模型在生产中可能的有效性。一旦你决定了你的模型，就需要在整个数据集上重新拟合模型：

clf.fit(X,y)

然后你可以使用clf.predict或clf.predict_proba获取预测结果。