使用LightGBM中的'predict_contrib'函数来获取SHAP值

5
在LightGBM 文档中提到,可以设置predict_contrib=True来预测SHAP值。
除了使用shap包之外,我们如何提取SHAP值?
我已经尝试过。
model = LGBM(objective="binary",is_unbalance=True,predict_contrib=True)
model.fit(X_train,y_train)
pred_shap = opt_model.predict(X_train) #Does not get SHAP-values

似乎不起作用

2个回答

6

使用pred_contrib=True的方式,以LGBM为例,对Shap值进行评估:

from lightgbm.sklearn import LGBMClassifier
from sklearn.datasets import load_iris

X,y = load_iris(return_X_y=True)
lgbm = LGBMClassifier()
lgbm.fit(X,y)
lgbm_shap = lgbm.predict(X, pred_contrib=True)
# Shape of returned LGBM shap values: 4 features x 3 classes + 3 expected values over the training dataset
print(lgbm_shap.shape)
# 0th row of LGBM shap values for 0th feature
print(lgbm_shap[0,:4])

输出:

(150, 15)
[-0.0176954   0.50644615  5.56584344  3.43032313]

shap计算的Shap值:

import shap
explainer = shap.TreeExplainer(lgbm)
shap_values = explainer.shap_values(X)
# num of predicted classes
print(len(shap_values))
# shap values for 0th class for 0th row
print(shap_values[0][0])

输出:

3
array([-0.0176954 ,  0.50644615,  5.56584344,  3.43032313])

在我看来,它看起来一样。


尝试逐行复制建议的代码片段,看看它与你的代码有何不同。 - Sergey Bushmanov
可能也是原因! - CutePoison
.predict()方法中应该设置pred_contrib=True - Sergey Bushmanov
我认为你(和我)正在读正确的内容。我相信文档在这种情况下是误导性的(过时?文件中的错别字?)。首先,请查看文档,了解应在“predict”方法中应用“predict_contrib”的相关信息。其次,请尝试使用“lgbm.predict?”并查看它所期望的参数。实际上,解决此类问题的最佳方法是查看源代码。 - Sergey Bushmanov
predict_contrib 在 LightGBM 中是如何工作的? - Joey Gao
显示剩余4条评论

3
混淆是由于两个不同的lightgbm API 中控制参数的重复(不一致命名)而引起的。
这两个主要的API各自使用自己的拼写: 文档更倾向于C版本(甚至不考虑python API的拼写作为别名...)。

网页内容由stack overflow 提供, 点击上面的
可以查看英文原文,
原文链接