我有一个Kafka集群,它基于数据更改从源接收消息。在某些情况下,这些消息是为将来处理而设计的。因此,我有两个选择:
- 消费所有消息,并将那些要用于未来的消息发布回Kafka,使用不同的主题(主题名称中带有日期),并拥有一个Storm拓扑,查找具有该日期名称的主题。这将确保只在指定日期处理消息。
- 将其存储在单独的数据库中,并构建一个调度程序,读取消息并仅在未来的日期上将其发布到Kafka。