哪个Python模型等同于'GBTRegressor' Pyspark模型?
简要背景:我正在尝试将Pyspark模型重建为Python模型。现有管道中使用的模型是GBTRegressor。我想知道这个模型在Python中的等效模型,以便我可以使用相似的参数并在Python上部署该模型。
哪个Python模型等同于'GBTRegressor' Pyspark模型?
简要背景:我正在尝试将Pyspark模型重建为Python模型。现有管道中使用的模型是GBTRegressor。我想知道这个模型在Python中的等效模型,以便我可以使用相似的参数并在Python上部署该模型。
GBTRegressor 是用于回归的梯度提升树算法。如果想在 Python 中实现该算法,可以使用 sklearn 的实现。以下是在糖尿病数据集上使用 GBT 回归的简单示例:
import matplotlib.pyplot as plt
import numpy as np
from sklearn import datasets, ensemble
from sklearn.inspection import permutation_importance
from sklearn.metrics import mean_squared_error
from sklearn.model_selection import train_test_split
# loading Data
diabetes = datasets.load_diabetes()
X, y = diabetes.data, diabetes.target
X_train, X_test, y_train, y_test = train_test_split(
X, y, test_size=0.1, random_state=13)
params = {'n_estimators': 500,
'max_depth': 4,
'min_samples_split': 5,
'learning_rate': 0.01,
'loss': 'ls'}
# fitting model
reg = ensemble.GradientBoostingRegressor(**params)
reg.fit(X_train, y_train)
mse = mean_squared_error(y_test, reg.predict(X_test))
print("The mean squared error (MSE) on test set: {:.4f}".format(mse))