我想更新我的pyspark代码。在pyspark中,必须将基本模型放入管道中,管道的office demo使用逻辑回归作为基本模型。然而,似乎无法在管道API中使用XGboost模型。我该如何像这样使用pyspark?
from xgboost import XGBClassifier
...
model = XGBClassifier()
model.fit(X_train, y_train)
pipeline = Pipeline(stages=[..., model, ...])
...
使用管道API非常方便,有人能给出一些建议吗?谢谢。