我目前正使用.NET的Kafka消费者处理大量的Kafka消息。
在我的处理流程中,第一步是解析JSON并丢弃基于JSON中特定字段值的许多消息。
我想要做的就是在第一时间不处理(也就是不下载)那些不需要的消息。
看起来像是kSql查询 - 通过推送查询方式编写 - 可以有效地过滤掉我需要处理的消息。
但是,我该如何通过.NET进行消费呢?我看到一些文档提到了REST API,但我怀疑这不是一个好主意。因为我需要在一天中的高峰时段处理超过10万条记录。(如果我可以有选择地下载和处理消息,我只会处理当前数量的三分之一。)
不幸的是,我无法控制发布者,因此无法更改消息的发布方式或内容。