PySpark:保存机器学习模型

8

请问有没有人可以给出一个在pySpark中保存机器学习模型的示例?

对于

ml.classification.LogisticRegressionModel

我会尝试使用以下内容:

我尝试使用以下内容:

model.save("path")

但是似乎没有起作用。


你遇到了什么错误?提供更多细节(堆栈跟踪和代码)可能会有所帮助。 - vkuo
1
它只是说找不到同名的方法(顺便说一下,我正在使用Spark 1.6.1) - ml_0x
我正在运行v2.2.0版本,但是遇到了AttributeError: 'RandomForestRegressor'对象没有'save'属性的问题。谷歌无法帮助我解决这个问题。所有文档都表明这应该可以工作。 - ericgtaylor
2个回答

1

但这属于mllib。ml是否继承了这些函数?无论如何,这听起来是合理的,因为我没有使用spark context(sc)。谢谢! - ml_0x
这个问题最好在https://dev59.com/PV0a5IYBdhLWcg3whJDW中得到解答,但是你的方法应该是一样的。如果这个方法有效,请接受这个答案作为正确的答案! - vkuo
明天我会试一下,因为现在我没有访问pyspark的权限。非常感谢! - ml_0x

0
在 Spark 2.3.0 中,如果您正在使用 ML:
model.save("path")

参考: Spark ML模型.save

(我刚刚运行了LogisticRegression并保存了它。)


但如果您正在使用mllib,则可以像其他答案建议的那样使用:

save(sc, path)

参考:Spark MLLib模型.save


网页内容由stack overflow 提供, 点击上面的
可以查看英文原文,
原文链接