我一直在尝试使用shap
包。我想要从我的逻辑回归模型中确定shap值。与TreeExplainer
相反,LinearExplainer
需要所谓的掩模器(masker)。这个掩模器到底是做什么的,独立掩模器和分区掩模器有什么区别?
同时,我对测试集中的重要特征感兴趣。那我需要在训练集还是测试集上拟合掩膜器? 下面是代码片段。
model = LogisticRegression(random_state = 1)
model.fit(X_train, y_train)
masker = shap.maskers.Independent(data = X_train)
**or**
masker = shap.maskers.Independent(data = X_test)
explainer = shap.LinearExplainer(model, masker = masker)
shap_val = explainer(X_test)```