我正在寻找一种创建流应用程序的方式,它可以承受每秒数百万个事件,并实时输出这些事件的不同计数。由于此流未受任何时间窗口限制,因此显然必须由某些存储支持。然而,我无法找到在保持良好抽象级别的情况下执行此操作的最佳方法(这意味着我希望有一个框架来处理存储和计数,否则我根本不需要框架)。对我而言,首选的存储是Cassandra和Redis(最好两者都有)。
我考虑的选项是Flink、Spark和Kafka Streams。我确实了解它们之间的区别,但仍然无法选择最佳解决方案。能否给些建议?谢谢。
我考虑的选项是Flink、Spark和Kafka Streams。我确实了解它们之间的区别,但仍然无法选择最佳解决方案。能否给些建议?谢谢。