基于Kafka的事件溯源并发写入

Question

基于Kafka的事件溯源并发写入

5

我一直在考虑在事件溯源配置中使用Apache Kafka作为事件存储。发布的事件将与特定资源相关联，交付到与资源类型相关联的主题，并通过资源ID将其分片到分区中。例如，创建资源类型为Folder且ID为1的资源将生成一个FolderCreate事件，该事件将被交付到“folders”主题中，在该主题的分区中根据ID 1对总分区数进行划分。即使我不知道如何处理使日志不一致的并发事件。

最简单的情况是存在两个可以使彼此无效的并发操作，例如更新文件夹和销毁同一文件夹的操作。在这种情况下，该主题的分区可能包含无效序列[FolderDestroy，FolderUpdate]。该情况通常通过对事件进行版本控制（正向并发性和幂等性）解决，具体请参见这里，但Kafka不支持该功能。

那么，有什么方法可以确保在这些情况下Kafka日志本身的一致性呢？

- Jesuspc

你读过这个吗？https://dev59.com/o2Mm5IYBdhLWcg3wT9qU - Constantin Galbenu

1个回答

网页内容由stack overflow 提供, 点击上面的

可以查看英文原文，
原文链接

- TomW · Accepted Answer

我认为可以使用Kafka对聚合（在DDD意义下）或“资源”进行事件溯源。以下是一些注意事项：

按分区序列化写入，每个分区使用一个进程（或多个分区）来管理此过程。确保将消息串行地发送到同一Kafka连接，并在向命令发送方报告成功之前使用ack=all，如果您无法承担回滚成本。确保生产者进程跟踪每个资源的当前成功事件偏移/版本，以便在发送消息之前自己进行乐观检查。
由于即使写入实际上成功了，也可能返回写入失败，因此您需要重试写入并通过在每个事件中包含一个ID来处理去重复，或通过重新读取流（最近的消息）来重新初始化生产者，以查看写入是否实际起作用。
原子地写入多个事件-只需发布包含事件列表的组合事件。
按资源ID查找。这可以通过在启动时从分区读取所有事件（或从特定的跨资源快照读取所有事件），并将当前状态存储在RAM中或缓存在数据库中来实现。

https://issues.apache.org/jira/browse/KAFKA-2260 可以更简单地解决1，但似乎已经停滞不前。

Kafka Streams似乎为您提供了很多功能。例如，4是一个KTable，您可以让事件生产者使用它来确定事件是否对当前资源状态有效，然后再发送它。