我正在向postgresql数据库加载一个相当庞大的文件。为此,我首先使用
问题是分割文件需要大约7小时的时间,然后它开始每个核心加载一个文件。我需要一种方法来告诉
我已经阅读了“split”手册,但没有找到任何信息。 有没有使用“split”或其他工具来完成这个任务的方法?
split
将文件分成较小的文件(每个30GB),然后使用GNU Parallel
和psql copy
将每个较小的文件加载到数据库中。问题是分割文件需要大约7小时的时间,然后它开始每个核心加载一个文件。我需要一种方法来告诉
split
在完成写入文件时打印文件名到标准输出,以便我可以将其管道传输到Parallel
并在split
完成写入后开始加载文件。类似于这样的东西:split -l 50000000 2011.psv carga/2011_ | parallel ./carga_postgres.sh {}
我已经阅读了“split”手册,但没有找到任何信息。 有没有使用“split”或其他工具来完成这个任务的方法?