也许这已经有很好的文档记录了,但我非常困惑如何做到这一点(有许多Apache工具)。
当我创建一个SQL表时,我使用以下命令来创建表:
CREATE TABLE table_name(
column1 datatype,
column2 datatype,
column3 datatype,
.....
columnN datatype,
PRIMARY KEY( one or more columns )
);
如何将这个现有的表格转换为Parquet格式?该文件已写入磁盘?如果原始数据有几GB,需要等待多长时间?
我能否将原始数据格式化为Parquet格式?