我的公司使用 git-sync
将压缩的 DAG 同步到 Airflow 中。我们使用 Airflow Helm Charts 部署 Airflow。我想知道是否可以让 Airflow 只在 git 分支的特定文件夹(例如 dags-dev
)中选择要运行的压缩的 DAG,而不是所有压缩的 DAG?
以下是一些有用的参考资料。
Airflow Helm Charts 的值文件。 https://github.com/helm/charts/blob/master/stable/airflow/values.yaml
我们的 DAG 代码如下:
dags:
doNotPickle: true
git:
url: <git url>
ref: master
gitSync:
enabled: true
image:
repository: <some repo>
tag: 1.0.7
refreshTime: 60
initContainer:
enabled: true
image:
repository: <some repo>
tag: 1.0.7
Airflow的git同步配置如下:
AIRFLOW__KUBERNETES__DAGS_VOLUME_SUBPATH: repo # must match AIRFLOW__KUBERNETES__GIT_SUBPATH
AIRFLOW__KUBERNETES__GIT_REPO: <git repo>
AIRFLOW__KUBERNETES__GIT_BRANCH: master
AIRFLOW__KUBERNETES__GIT_DAGS_FOLDER_MOUNT_POINT: /opt/airflow/dags
AIRFLOW__KUBERNETES__GIT_USER: <some user>
AIRFLOW__KUBERNETES__GIT_PASSWORD: <some password>
AIRFLOW__KUBERNETES__GIT_SYNC_CONTAINER_REPOSITORY: gitlab.beno.ai:4567/eng/external-images/k8s.gcr.io/git-sync
AIRFLOW__KUBERNETES__GIT_SYNC_CONTAINER_TAG: v3.1.1