我有一个Airflow DAG,其中任务数量超过100,000个。我只能运行最多1000个任务。超过这个数量后,调度程序会挂起,Web服务器无法呈现任务,并且UI界面非常缓慢。
我尝试增加“min_file_process_interval”和“processor_poll_interval”配置参数。
我将“num_duration”设置为3600,以便调度程序每小时重新启动一次。
我是否达到了Web服务器或调度程序的限制?总的来说,如何处理Airflow中大量的任务?任何配置设置等都将非常有帮助。
此外,在这种规模下,我应该使用SubDagOperator吗?请给予建议。
谢谢,
我尝试增加“min_file_process_interval”和“processor_poll_interval”配置参数。
我将“num_duration”设置为3600,以便调度程序每小时重新启动一次。
我是否达到了Web服务器或调度程序的限制?总的来说,如何处理Airflow中大量的任务?任何配置设置等都将非常有帮助。
此外,在这种规模下,我应该使用SubDagOperator吗?请给予建议。
谢谢,