来自Spark编程指南
为了自动恢复驱动程序故障,用于运行流处理应用程序的部署基础设施必须监视驱动程序进程,并在其出现故障时重新启动驱动程序。不同的集群管理器有不同的工具来实现这一点。
Spark Standalone
- Spark Standalone - Spark应用程序驱动程序可以被提交以在Spark Standalone集群内运行(参见集群部署模式),也就是说,应用程序驱动程序本身在一个工作节点上运行。此外,Standalone集群管理器可以被指示监督驱动程序,并在驱动程序由于非零退出代码或驱动程序运行节点故障而失败时重新启动它。有关详细信息,请参见Spark Standalone指南中的集群模式和监管。
- YARN - Yarn支持类似的机制来自动重新启动应用程序。请参考YARN文档以获取更多详细信息。 ....
所以,问题是如何在Yarn上支持Spark Streaming的自动重启。 谢谢并致以最好的问候,
Tao
spark.driver.supervise
或--supervise
目前在 YARN 上还不被支持。 - CᴴᴀZ