我在网上搜索过并访问了中位数算法的维基页面。但好像没有找到明确回答我的问题:
如果有一个非常非常大(TB级别)的整数列表,想以分布式方式查找此列表的中位数,将该列表分成不同大小的子列表(或等大小的子列表),然后继续计算这些较小子列表的中位数,那么计算出来的中位数列表再计算一次中位数能不能得到原始大列表的中位数?
此外,对于任何第k个统计信息,此说明是否也正确? 我会对这个领域的研究链接感兴趣。
我在网上搜索过并访问了中位数算法的维基页面。但好像没有找到明确回答我的问题:
如果有一个非常非常大(TB级别)的整数列表,想以分布式方式查找此列表的中位数,将该列表分成不同大小的子列表(或等大小的子列表),然后继续计算这些较小子列表的中位数,那么计算出来的中位数列表再计算一次中位数能不能得到原始大列表的中位数?
此外,对于任何第k个统计信息,此说明是否也正确? 我会对这个领域的研究链接感兴趣。