在阅读LightGBM文档时,我发现predict
支持一个pred_leaf
参数。文档中提到:
pred_leaf (bool, optional (default=False)) – Whether to predict
leaf index.
然而,当进行
时data := (1, 28)
gbm := num_boost_round = X
embedding = gbm.predict(data, pred_leaf=True)
embedding.shape # [1, X]
print(embedding[0, :]) # [29, 2, 8, 26, 2, 2, 16, 18, 25, 30, 16, 25, 0, 17, 15]
我不明白为什么它输出一个填充的数组,而不是一个one-hot向量或标量值?它说它预测叶子索引?这可以用作嵌入到另一个模型中吗?
附:我想在stats-stackexchange上发布此内容,但似乎这是1)特定于lightgbm和2)他们没有lightgbm标签。