我已经测试了hadoop和cloudera的mapreduce,感觉很棒,我认为它是最新和最相关的大数据解决方案。但是几天前,我发现了这个:https://spark.incubator.apache.org/
这是一个“闪电般快速的集群计算系统”,能够在Hadoop集群上运行,似乎能够击败mapreduce。我发现与mapreduce相比,它更多地使用内存。我认为当您需要进行集群计算以克服单台机器上可能出现的I / O问题时,mapreduce仍然很重要。 但是由于Spark可以完成mapreduce的工作,并且在某些操作上可能更加高效,那么MapReduce的终结是否已经到来?还是MapReduce可以在某些情况下比Spark更有效?