我正在尝试使用离堆存储在Spark 1.4.0和Tachyon 0.6.4上持久化我的RDD,方法如下:val a = sqlContext.parquetFile("a1.parquet") a.persist(org.apache.spark.storage.StorageLevel.OF...
我试图理解Spark的内存特性。在这个过程中,我遇到了Tachyon,它基本上是一种内存数据层,通过使用血统系统提供容错性而不需要复制,并通过检查点数据集来减少重新计算。现在让我困惑的是,所有这些功能也可以通过Spark标准RDD系统实现。那么,RDD是否在幕后实现了Tachyon以实现这些功...
我想了解在Yarn集群模式下,Spark Driver是否是单点故障。因此,我希望更好地了解有关此上下文中的YARN Container的故障转移过程的内部情况。 我知道Spark Driver将在Yarn Container中的Spark Application Master中运行。如果需...