LightGBM超参数调优随机搜索CV

4

我有一个数据集,用于训练和测试,其尺寸如下:

X_train = (58149, 9)
y_train = (58149,)

X_test = (24921, 9) 
y_test = (24921,)

我使用LightGBM分类器的RandomizedSearchCV代码如下:

# Parameters to be used for RandomizedSearchCV-
rs_params = {
        # 'bagging_fraction': [0.6, 0.66, 0.7],
        'bagging_fraction': sp_uniform(0.5, 0.8),
        'bagging_frequency': sp_randint(5, 8),
        # 'feature_fraction': [0.6, 0.66, 0.7],
        'feature_fraction': sp_uniform(0.5, 0.8),
        'max_depth': sp_randint(10, 13),
        'min_data_in_leaf': sp_randint(90, 120),
        'num_leaves': sp_randint(1200, 1550)

}

# Initialize a RandomizedSearchCV object using 5-fold CV-
rs_cv = RandomizedSearchCV(estimator=lgb.LGBMClassifier(), param_distributions=rs_params, cv = 5, n_iter=100)

# Train on training data-
rs_cv.fit(X_train, y_train)

执行这段代码时,出现以下错误:

LightGBMError: 在/__w/1/s/python-package/compile/src/io/config_auto.cpp的第295行处检查失败: bagging_fraction <=1.0。

你有什么想法是出了什么问题吗?
1个回答

2
我已经从你的代码中删除了sp_uniformsp_randint,现在它可以正常工作了。"Original Answer"翻译成"最初的回答"。
from sklearn.model_selection import RandomizedSearchCV
import lightgbm as lgb
np.random.seed(0)

d1 = np.random.randint(2, size=(100, 9))
d2 = np.random.randint(3, size=(100, 9))
d3 = np.random.randint(4, size=(100, 9))

Y = np.random.randint(7, size=(100,))
X = np.column_stack([d1, d2, d3])

rs_params = {
        'bagging_fraction': (0.5, 0.8),
        'bagging_frequency': (5, 8),
        'feature_fraction': (0.5, 0.8),
        'max_depth': (10, 13),
        'min_data_in_leaf': (90, 120),
        'num_leaves': (1200, 1550)
}

# Initialize a RandomizedSearchCV object using 5-fold CV-
rs_cv = RandomizedSearchCV(estimator=lgb.LGBMClassifier(), param_distributions=rs_params, cv = 5, n_iter=100,verbose=1)

# Train on training data-
rs_cv.fit(X, Y,verbose=1)

根据文档,bagging_fraction的值应为<=0或>=1。

添加verbose=1以便查看模型的拟合情况,verbose提供了有关模型的信息。

原始答案:Original Answer


网页内容由stack overflow 提供, 点击上面的
可以查看英文原文,
原文链接