我是机器学习的新手,希望能得到以下方面的帮助:
我在我的数据上运行了一个支持向量机分类器(SVC),使用10折交叉验证计算了准确率分数(约为89%)。我使用Python和scikit-learn来执行此任务。以下是代码片段:
现在,我如何使用我的分类器(在运行10折交叉验证后)对X_test进行测试,并将预测结果与y_test进行比较?正如您所注意到的那样,在交叉验证过程中,我只使用了X_train和y_train。
我注意到sklearn有cross_val_predict:http://scikit-learn.org/stable/modules/generated/sklearn.model_selection.cross_val_predict.html 我应该用cross_val_predict替换我的cross_val_score吗?仅供参考:我的目标数据列已经二值化(具有0和1的值)。
如果我的方法是错误的,请建议我最好的处理方式。
谢谢!
我在我的数据上运行了一个支持向量机分类器(SVC),使用10折交叉验证计算了准确率分数(约为89%)。我使用Python和scikit-learn来执行此任务。以下是代码片段:
def get_scores(features,target,classifier):
X_train, X_test, y_train, y_test =train_test_split(features, target ,
test_size=0.3)
scores = cross_val_score(
classifier,
X_train,
y_train,
cv=10,
scoring='accuracy',
n_jobs=-1)
return(scores)
get_scores(features_from_df,target_from_df,svm.SVC())
现在,我如何使用我的分类器(在运行10折交叉验证后)对X_test进行测试,并将预测结果与y_test进行比较?正如您所注意到的那样,在交叉验证过程中,我只使用了X_train和y_train。
我注意到sklearn有cross_val_predict:http://scikit-learn.org/stable/modules/generated/sklearn.model_selection.cross_val_predict.html 我应该用cross_val_predict替换我的cross_val_score吗?仅供参考:我的目标数据列已经二值化(具有0和1的值)。
如果我的方法是错误的,请建议我最好的处理方式。
谢谢!
from sklearn.model_selection import cross_val_score
- mrazizi