我目前在PiCloud上运行一个涉及ODE求解器的多次迭代项目。每次迭代会产生一个约30行1500列的NumPy数组,每个迭代结果都会附加到先前结果的数组底部。
通常,我会让这些相当大的数组由函数返回,将它们保存在内存中,并一次性处理它们。但是,PiCloud对函数返回的数据大小有相当严格的限制,以减少传输成本。这没问题,但这意味着我必须启动数千个作业,每个作业运行一个迭代,这会带来相当大的开销。
最好的解决方案似乎是将输出写入文件,然后使用另一个没有传输限制的函数收集该文件。
我的最佳选择是将其转储到CSV文件中吗?我应该每次迭代都添加到CSV文件中,还是将所有内容保存在数组中,最后只写一次?我是否遗漏了什么非常聪明的方法?
通常,我会让这些相当大的数组由函数返回,将它们保存在内存中,并一次性处理它们。但是,PiCloud对函数返回的数据大小有相当严格的限制,以减少传输成本。这没问题,但这意味着我必须启动数千个作业,每个作业运行一个迭代,这会带来相当大的开销。
最好的解决方案似乎是将输出写入文件,然后使用另一个没有传输限制的函数收集该文件。
我的最佳选择是将其转储到CSV文件中吗?我应该每次迭代都添加到CSV文件中,还是将所有内容保存在数组中,最后只写一次?我是否遗漏了什么非常聪明的方法?