coremltools无法将XGBoost分类器转换为coreML模型。

4

我有一个关于coremltools的问题。

我想将训练好的xgboost分类器模型转换成coreML模型。

import coremltools
import xgboost as xgb


X, y = get_data()

xgb_model = xgb.XGBClassifier()
xib_model.train(X, y)
coreml_model = coremltools.converters.xgboost.convert(xgb_model)
coremltools.save('my_model.mlmodel')

错误如下:
>>> coremltools.converters.xgboost.convert(xgb_model)
Traceback (most recent call last):
  File "<stdin>", line 1, in <module>
  File "/Users/karas/.pyenv/versions/anaconda2-4.3.0/lib/python2.7/site-packages/coremltools/converters/xgboost/_tree.py", line 51, in convert
    return _MLModel(_convert_tree_ensemble(model, feature_names, target, force_32bit_float = force_32bit_float))
  File "/Users/karas/.pyenv/versions/anaconda2-4.3.0/lib/python2.7/site-packages/coremltools/converters/xgboost/_tree_ensemble.py", line 143, in convert_tree_ensemble
    raise TypeError("Unexpected type. Expecting XGBoost model.")
TypeError: Unexpected type. Expecting XGBoost model.

你找到解决方案了吗? - kelin
1个回答

1
快速解决方案:
coreml_model = coremltools.converters.xgboost.convert(xgb_model._Booster)

关于这个转换器的更多信息: 我刚遇到了这个问题,所以我调试了_tree_ensemble.py,以下是我的发现:

第一个参数“model”应该是_xgboost.core.Booster_xgboost.XGBRegressor或前两种数据的.json文件路径。此外,如果使用.json文件,则必须提供第二个参数feature_names

另外,根据github上的Python示例, 你还可以通过其他方式获取模型:

import numpy as np
import scipy.sparse
import pickle
import xgboost as xgb

### simple example
# load file from text file, also binary buffer generated by xgboost
dtrain = xgb.DMatrix('../data/agaricus.txt.train')
dtest = xgb.DMatrix('../data/agaricus.txt.test')

# specify parameters via map, definition are same as c++ version
param = {'max_depth':2, 'eta':1, 'silent':1, 'objective':'binary:logistic'}

# specify validations set to watch performance
watchlist = [(dtest, 'eval'), (dtrain, 'train')]
num_round = 2
booster = xgb.train(param, dtrain, num_round, watchlist)

注意这里的booster_xgboost.core.Booster
然后你可以这样做:
import coremltools
coreml_model = coremltools.converters.xgboost.convert(booster)
coreml_model.save('my_model.mlmodel')

我使用了你的第一种方法,它可以工作,但现在问题是它需要100个不同的输入,而我希望它只接收一个特征向量。我该如何处理?你有什么想法吗?就像f00、f01等等。谢谢。 - Ali

网页内容由stack overflow 提供, 点击上面的
可以查看英文原文,
原文链接