我想在PySpark中使用预训练的XGBoost分类器,但是集群上的节点没有安装XGBoost模块。我可以将已经训练好的分类器进行pickle并广播,但这不够,因为我仍然需要加载模块到每个集群节点。
由于我没有root权限,并且没有共享文件系统,因此无法在集群节点上安装它。
如何分发XGBoost分类器以在Spark中使用?
我对xgboost有一些了解。类似http://apache-spark-user-list.1001560.n3.nabble.com/Loading-Python-libraries-into-Spark-td7059.html或https://dev59.com/uGAf5IYBdhLWcg3wZSBI#24686708这样的方法能行吗?
由于我没有root权限,并且没有共享文件系统,因此无法在集群节点上安装它。
如何分发XGBoost分类器以在Spark中使用?
我对xgboost有一些了解。类似http://apache-spark-user-list.1001560.n3.nabble.com/Loading-Python-libraries-into-Spark-td7059.html或https://dev59.com/uGAf5IYBdhLWcg3wZSBI#24686708这样的方法能行吗?