有没有办法将命令行参数传递给Airflow BashOperator?目前,我有一个接受日期参数并执行一些特定活动(如清理早于给定日期的特定文件夹)的Python脚本。
在只有一个任务的简化代码中,我想要做的是:
from __future__ import print_function
from airflow.operators import BashOperator
from airflow.models import DAG
from datetime import datetime, timedelta
default_args = {
'owner' : 'airflow'
,'depends_on_past' : False
,'start_date' : datetime(2017, 01, 18)
,'email' : ['abc@xyz.com']
,'retries' : 1
,'retry_delay' : timedelta(minutes=5)
}
dag = DAG(
dag_id='data_dir_cleanup'
,default_args=default_args
,schedule_interval='0 13 * * *'
,dagrun_timeout=timedelta(minutes=10)
)
cleanup_task = BashOperator(
task_id='task_1_data_file_cleanup'
,bash_command='python cleanup.py --date $DATE 2>&1 >> /tmp/airflow/data_dir_cleanup.log'
#--------------------------------------^^^^^^-- (DATE variable which would have been given on command line)
#,env=env
,dag=dag
)
提前感谢您的帮助,
{{ params.DATE }}
而不是{{ DATE }}
以明确其来源。更进一步,由于它不是常量,我会使用小写的{{ params.date }}
。 - nandoquintana