我正在研究将kafka偏移量存储在kafka中,以用于Spark Structured Streaming,就像DStreams一样工作stream.asInstanceOf[CanCommitOffsets].commitAsync(offsetRanges)
。 我正在寻找相同的东西,但是针对结构化流。
它是否支持结构化流? 如果是,我该如何实现?
我知道可以使用.option("checkpointLocation", checkpointLocation)
进行hdfs检查点,但我只对内置偏移管理感兴趣。
我希望kafka仅在内部存储偏移量,而不需要spark hdfs检查点。