我正在使用Scala,并使用以下Spark Streaming方法从Kafka消费数据:
val lines = KafkaUtils.createDirectStream[String, String, StringDecoder, StringDecoder](ssc, kafkaParams, topics).map(_._2)
上述变量通过以下代码返回InputDStream,我能够以原始/二进制格式查看数据:
println(line)
但是我需要将avro格式(已提供模式)应用于原始/二进制格式,以便以期望的JSON格式查看数据。为了应用avro格式,我需要将上述InputDStream转换为Array [Bytes],该数组由avro使用。
请问有人可以告诉我如何将InputDStream转换为Array [Bytes]吗?
或者
如果您知道在InputDStream(Spark Streaming)上应用avro模式的更好方法,请分享。