我有一个数据集,其中包含8个参数(4个连续的和4个分类的),我正在尝试使用Scikit中的RFEC类来消除特征。
这是我正在使用的公式:
svc = SVC(kernel="linear")
rfecv = RFECV(estimator=svc, step=1, cv=StratifiedKFold(y, 2),
scoring='accuracy')
rfecv.fit(X, y)
由于我有分类数据,所以我使用dmatrics(Patsy)将其更改为虚拟变量。
在特征选择后,我想尝试不同的分类模型来改进模型,以及SVC。
在对数据进行转换后,我运行了RFE,但我认为我做错了。
我们是在转换分类数据之前还是之后运行RFECV?
我找不到任何文档中的明确指示。