Flink被与Spark相比较,但我认为这是错误的比较,因为它将一个窗口事件处理系统与微批处理进行比较;同样,将Flink与Samza进行比较对我来说也没有太多意义。在这两种情况下,它比较了实时和批处理事件处理策略,即使在Samza的情况下规模更小。但我想知道Flink与Storm相比如何,因为后者在概念上更加相似。
我发现 this(第四张幻灯片)记录了Flink的主要区别为“可调节延迟”。另一个提示来自Slicon Angle的一篇文章,建议Flink更好地集成到Spark或HadoopMR世界中,但没有提及或引用任何实际细节。最后,Fabian Hueske本人在一次采访中指出,“与Apache Storm相比,Flink的流分析功能提供了高级API,并使用更轻量级的容错策略,以提供精确的处理保证。”对我来说,这一切有点稀疏,我不太明白重点是什么。 有人能解释一下Storm中的流处理问题由Flink准确解决了哪些问题吗? Hueske所提到的API问题和他们的“更轻量级的容错策略”是指什么?