大家都说Spark使用内存,因此比Hadoop快得多。
从Spark文档中,我不理解真正的差别在哪里。
- Spark将数据存储在内存中,而Hadoop则不是这样做的。
- 如果数据太大而无法存储在内存中,会发生什么?在这种情况下,它与Hadoop有多相似?
大家都说Spark使用内存,因此比Hadoop快得多。
从Spark文档中,我不理解真正的差别在哪里。
Spark also adds libraries for doing things like machine learning, streaming, graph programming and SQL