我想知道如何实现
就像在https://spark.apache.org/docs/latest/api/python/_modules/pyspark/sql/dataframe.html#DataFrame.summary中所示。
df.describe()
和df.summary()
。就像在https://spark.apache.org/docs/latest/api/python/_modules/pyspark/sql/dataframe.html#DataFrame.summary中所示。
def summary(self, *statistics):
if len(statistics) == 1 and isinstance(statistics[0], list):
statistics = statistics[0]
jdf = self._jdf.summary(self._jseq(statistics))
return DataFrame(jdf, self.sql_ctx)
我对Python中的面向对象编程不太熟悉,有些困惑。分位数和其他统计量在哪里实现了?