Python中与Pyspark模型相当的内容。

3

哪个Python模型等同于'GBTRegressor' Pyspark模型?

简要背景:我正在尝试将Pyspark模型重建为Python模型。现有管道中使用的模型是GBTRegressor。我想知道这个模型在Python中的等效模型,以便我可以使用相似的参数并在Python上部署该模型。

1个回答

2

GBTRegressor 是用于回归的梯度提升树算法。如果想在 Python 中实现该算法,可以使用 sklearn 的实现。以下是在糖尿病数据集上使用 GBT 回归的简单示例:

import matplotlib.pyplot as plt
import numpy as np
from sklearn import datasets, ensemble
from sklearn.inspection import permutation_importance
from sklearn.metrics import mean_squared_error
from sklearn.model_selection import train_test_split

# loading Data
diabetes = datasets.load_diabetes()
X, y = diabetes.data, diabetes.target

X_train, X_test, y_train, y_test = train_test_split(
    X, y, test_size=0.1, random_state=13)

params = {'n_estimators': 500,
          'max_depth': 4,
          'min_samples_split': 5,
          'learning_rate': 0.01,
          'loss': 'ls'}

# fitting model

reg = ensemble.GradientBoostingRegressor(**params)
reg.fit(X_train, y_train)

mse = mean_squared_error(y_test, reg.predict(X_test))
print("The mean squared error (MSE) on test set: {:.4f}".format(mse))

非常感谢。您知道是否有任何文件可以确认这一点吗? - Prabhat Mangina
1
不客气。您可以在此处找到文档:https://scikit-learn.org/stable/modules/generated/sklearn.ensemble.GradientBoostingRegressor.html - Raha Moosavi

网页内容由stack overflow 提供, 点击上面的
可以查看英文原文,
原文链接