17得票5回答
Python的XGBoost:ValueError('feature_names不得包含[,]或<')

Python的XGBClassifier实现不接受字符[, ]或&lt;'作为特征名称。 如果发生这种情况,它会引发以下错误: ValueError('feature_names may not contain [, ] or &lt;') 显然,解决方案是传递等效的numpy数组,...

17得票3回答
将Python XGBoost的dMatrix转换为NumPy ndarray或Pandas DataFrame。

我正在按照xgboost在主要git上的示例进行操作 - https://github.com/dmlc/xgboost/blob/master/demo/guide-python/basic_walkthrough.py#L64 在此示例中,他们直接将文件放入dMatrix中进行读取 -d...

17得票3回答
在SciKit-Learn中使用交叉验证和XGBoost进行网格搜索和早期停止

我对sci-kit learn相当新,并一直尝试进行XGBoost的超参数调整。我的目标是使用早停和网格搜索来调整模型参数,使用早停来控制树的数量并避免过拟合。因为我在网格搜索中使用交叉验证,所以希望在早停标准中也使用交叉验证。到目前为止,我编写的代码如下:import numpy as np...

17得票4回答
R - XGBoost: 构建 DMatrix 时出现错误

我在使用R中的XGBoost时遇到了困难。 我正在读取一个CSV文件,其中包含我的数据:get_data = function() { #Loading Data path = "dados_eye.csv" data = read.csv(path) #Dividing into two ...

16得票2回答
尽管具有相同的列,但在xgboost中出现了feature_names不匹配的问题。

我有一个训练集(X)和测试集(test_data_process),它们具有相同的列和顺序,如下所示: 但是当我执行predictions = my_model.predict(test_data_process) 它给出以下错误: ValueError: feature_na...

16得票7回答
将SHAP总结图保存为PDF/SVG。

我目前在处理一个分类问题,并想创建特征重要性的可视化。我使用Python的XGBoost软件包,它已经提供了特征重要性图。但是,我发现shap (https://github.com/slundberg/shap)是一个基于树分类器的Python库,可以创建非常好的特征重要性图形。所有的东西都...

16得票4回答
REAL()只能应用于“numeric”,而不能应用于“integer”。

虽然这个问题似乎是重复的,但我发布这篇文章,因为没有一个解决方案与我的问题相关。 dtrain&lt;-xgb.DMatrix(data=data.matrix(train),label=data[t,c(31)]) xgb.DMatrix(data = data.matrix(trai...

16得票4回答
Sklearn将fit()参数传递到xgboost管道中

类似于如何在scikit learn中仅向管道对象的一个部分传递参数?我想要仅向管道的某个部分传递参数。通常,它应该像这样正常工作:estimator = XGBClassifier() pipeline = Pipeline([ ('clf', estimator) ...

16得票1回答
XGBoost生成预测结果和概率。

我可能在文档中看漏了,但我想知道是否有一种方法可以在XGBoost中生成预测结果和概率?在我的情况下,我正在尝试预测一个多类分类器。如果我能返回"Medium - 88%"就太好了。 分类器 = Medium 预测概率 = 88% 参数params = { 'max_depth...

16得票3回答
如何知道在XGBoost中创建了多少棵树

我有一个关于XGBoost的问题。 您知道如何了解在XGBoost中创建的树的数量吗? 与RandomForest不同,其模型制造者决定要创建多少棵树,XGBoost基本上会继续创建树直到损失函数达到某个特定值。因此我想知道这个值。 谢谢。