我是一个Spark的初学者,我想发出一个请求,以便让我检索最常访问的网页。
我的请求如下:
我的请求如下:
mostPopularWebPageDF = logDF.groupBy("webPage").agg(functions.count("webPage").alias("cntWebPage")).agg(functions.max("cntWebPage")).show()
通过这个请求,我只获取了一个最大计数的数据框,但我想获取一个包含该分数和保持该分数的网页的数据框。
类似于这样:
webPage max(cntWebPage)
google.com 2
我该如何解决我的问题?
非常感谢。