我目前正在使用支持向量机对dicom图像进行交叉验证方法进行分类,使用的代码如下:
#Cross Validation using k-folds
clf = svm.SVC(kernel='linear')
scores = cross_validation.cross_val_score(clf,X,Y,cv=16))
print scores
print("Accuracy: %0.2f (+/- %0.2f)" % (scores.mean(),scores.std()*2))
您可以看到,我目前正在使用16个折叠,如何找到最佳的折叠数量?是否更多就更好?
此外,我发现在使用交叉验证时,我的准确度得分从66%到100%变化很大,通常给出平均准确度为82%-85%。有什么建议可以改善这种情况,并确保分类器从每个类别中选择相等数量的图像?
抱歉,我对Python非常陌生!
感谢任何建议!