我有一堆存储在S3上的Parquet文件,希望以最优方式将它们加载到Redshift中。
每个文件都被拆分成多个块......从S3加载数据到Redshift的最佳方法是什么?
此外,如何在Redshift中创建目标表定义?是否有一种方法可以从Parquet中推断模式并通过编程方式创建表?我相信可以使用Redshift Spectrum来完成这项工作,但是我想知道是否可以使用脚本完成。
感谢您的帮助!
我正在考虑使用所有AWS工具(例如Glue、Lambda等)以最优方式执行此操作(性能、安全性和成本)。
每个文件都被拆分成多个块......从S3加载数据到Redshift的最佳方法是什么?
此外,如何在Redshift中创建目标表定义?是否有一种方法可以从Parquet中推断模式并通过编程方式创建表?我相信可以使用Redshift Spectrum来完成这项工作,但是我想知道是否可以使用脚本完成。
感谢您的帮助!
我正在考虑使用所有AWS工具(例如Glue、Lambda等)以最优方式执行此操作(性能、安全性和成本)。