我有两个结构(schema)相同的Hive表格。如何编写高效的SQL查询将它们合并成一个具有相同结构的单一表格?
更新,以下代码在我的情况下运行速度很快:
CREATE TABLE xy AS SELECT *
FROM (
SELECT *
FROM x
UNION ALL
SELECT *
FROM y
) tmp;
我有两个结构(schema)相同的Hive表格。如何编写高效的SQL查询将它们合并成一个具有相同结构的单一表格?
更新,以下代码在我的情况下运行速度很快:
CREATE TABLE xy AS SELECT *
FROM (
SELECT *
FROM x
UNION ALL
SELECT *
FROM y
) tmp;
table_A
和table_b
合并成一个表,最简单的方法是使用UNION ALL
运算符。您可以在此处找到语法和用例:https://cwiki.apache.org/confluence/display/Hive/LanguageManual+Union。union all" 是一种正确的解决方案,但可能在资源/时间方面较为昂贵。我建议创建一个具有两个分区的表,一个用于表A,另一个用于表B。这样就不需要合并(或 union all)。当两个分区都被填充时,合并后的表即可用。
"