我想通过临时使用Hive来对HDFS上的文件执行一些操作,因此我不想使用内部表。但是我的数据非常庞大,例如1TB,因此我担心外部表的性能问题。因此,我提出了以下问题:Hive中表和外部表之间的性能差异。
我想通过临时使用Hive来对HDFS上的文件执行一些操作,因此我不想使用内部表。但是我的数据非常庞大,例如1TB,因此我担心外部表的性能问题。因此,我提出了以下问题:Hive中表和外部表之间的性能差异。
Create ORC table:
CREATE TABLE IF NOT EXISTS <orc_table_name>(
<col name> <type>)
COMMENT 'comments'
ROW FORMAT DELIMITED
FIELDS TERMINATED BY ','
STORED AS ORC;
INSERT OVERWRITE TABLE <orc_table_name> SELECT * FROM <external_table_name>;