1- 我正在尝试同时删除多个分区,但是无论使用Impala还是Hive都很难做到。我尝试了以下查询,有时会加上'
,有时不会:
ALTER TABLE cz_prd_corrti_st.s1mme_transstats_info DROP IF EXISTS
PARTITION (pr_load_time='20170701000317')
PARTITION (pr_load_time='20170701000831')
我遇到的错误如下:
AnalysisException: Syntax error in line 3: PARTITION (pr_load_time='20170701000831') ^ Encountered: PARTITION Expected: CACHED, LOCATION, PURGE, SET, UNCACHED CAUSED BY: Exception: Syntax error
这个分区列是bigint类型,只删除一个分区的查询可以正常工作:
ALTER TABLE cz_prd_corrti_st.s1mme_transstats_info DROP IF EXISTS
PARTITION (pr_load_time='20170701000317')
2- 在 Impala/Hive 中,先删除 HDFS 数据再删除分区是一个好习惯吗?还是应该反过来做?
partition (p<=3)
)目前还不能正常工作,请参见https://issues.apache.org/jira/browse/SPARK-14922。 - ruhong