tweetStream.foreachRDD((rdd, time) => {
val count = rdd.count()
if (count > 0) {
var fileName = outputDirectory + "/tweets_" + time.milliseconds.toString
val outputRDD = rdd.repartition(partitionsEachInterval)
outputRDD.saveAsTextFile(fileName)
}
我正在尝试以Python的方式检查流数据中的计数值或空RDD,但很难找到方法,我还尝试了下面链接中的示例。 http://spark.apache.org/docs/latest/streaming-programming-guide.html
def fibonacci(n): if n <= 1: return n else: return (fibonacci(n-1) + fibonacci(n-2)) for i in range(10): print(fibonacci(i))
以上是一个简单的 Python 代码,用于生成斐波那契数列。该代码使用递归函数来计算每个数字。在主程序中,我们使用 for 循环来打印前十个斐波那契数。 - nakashu