我现在正在准备将.csv文件中的数据存储到Hive中。当然,由于Parquet文件格式的良好性能,Hive表应该是Parquet格式。因此,通常的做法是创建一个格式为
但我认为这个临时textfile表并不是必要的。所以,我的问题是,有没有一种方法可以直接将这些本地的.csv文件加载到Hive Parquet格式表中,即不需要借助临时表?或者有更简单的方法来完成这个任务吗?
textfile
的临时表,然后将本地CSV文件数据加载到这个临时表中,最后创建一个相同结构的Parquet表并使用SQL insert into parquet_table values (select * from textfile_table);
。但我认为这个临时textfile表并不是必要的。所以,我的问题是,有没有一种方法可以直接将这些本地的.csv文件加载到Hive Parquet格式表中,即不需要借助临时表?或者有更简单的方法来完成这个任务吗?