通常,我可以在Hive中使用show partitions <table>
命令。但是当表格是Parquet格式时,Hive无法理解。我可以去HDFS检查目录结构,但这并不理想。有没有更好的方法来解决这个问题?
我正在使用Impala 1.4.0版本,可以查看分区信息。 在impala-shell中执行以下命令:
show partitions <mytablename>
我有一个类似于这样的东西:
+-------+-------+-----+-------+--------+---------+--------------+---------+
| year | month | day | #Rows | #Files | Size | Bytes Cached | Format |
+-------+-------+-----+-------+--------+---------+--------------+---------+
| 2013 | 11 | 1 | -1 | 3 | 25.87MB | NOT CACHED | PARQUET |
| 2013 | 11 | 2 | -1 | 3 | 24.84MB | NOT CACHED | PARQUET |
| 2013 | 11 | 3 | -1 | 2 | 19.05MB | NOT CACHED | PARQUET |
| 2013 | 11 | 4 | -1 | 3 | 23.63MB | NOT CACHED | PARQUET |
| 2013 | 11 | 5 | -1 | 3 | 26.56MB | NOT CACHED | PARQUET |
或者您可以到HDFS中查看您的表。它们通常在以下路径中显示:/user/hivestore/warehouse/<mytablename>
或
/user/hive/warehouse/<mytablename>