谓词下推处理的是哪些值将被扫描,而不是哪些列。 因此,如果您对列A应用过滤器,只返回具有值V的记录,则谓词下推会使parquet仅读取可能包含值V的块。 Parquet在多个级别上保持最小/最大统计信息,并将值V与这些最小/最大标题进行比较,并仅扫描最小/最大包含值V的块。这就是谓词下推。另一个parquet的特点是“投影下推”,它将数据存储在列中,因此当查询限制为特定列时,只有这些列会被返回。这个特性并不是所谓的谓词下推。
WHERE
子句中的条件。 - zero323