我正在处理一个二元分类问题,我的训练数据有数百万条记录和大约2000个变量。我正在使用lightGBM进行特征选择,并使用从lightGBM选择的特征运行神经网络(使用Keras)模型进行预测。我对我所遵循的方法有几个问题。
- 当使用lightGBM进行特征选择时,我正在进行超参数调整。这是基于我的理解,随着超参数的变化,所选的特征也会不同。我使用'goss'算法和'gain'作为特征重要性类型。我看过一些文章,他们使用lightGBM进行特征选择,但我没有看到任何人在进行超参数调整时只使用默认设置。这是正确的方法吗?
- 是否可以使用lightGBM进行特征选择,并使用从lightGBM选择的特征来构建神经网络模型以基于这些特征进行预测?