使用Airflow将数据从Postgres/MySQL移动到S3

6
我们正在尝试从Pentaho Kettle迁移到Apache Airflow来进行ETL,并将所有数据处理集中在一个工具下。
我们使用Kettle每天从Postgres/Mysql数据库读取数据,并将数据移动到S3->Redshift。
最简单的方法是什么?我没有看到可以直接完成此操作的Operator;所以我应该使用MySQL/Postgres operator将数据放入本地文件,然后使用S3 operator将数据移动到S3吗?
谢谢。
2个回答

4

2

1
请注意,运算符是由天文学家编写和维护的插件,您必须导入一个天文学家钩子。 - Javier Lopez Tomas
@JavierLópezTomás 谢谢您的提醒。我已经更新了答案以反映这一点。 - jbielick
@JavierLópezTomás,你如何导入天文学家的钩子?我已经搜索了他们的文档,但没有找到任何信息。换句话说,如果不购买订阅,是否有可能实现? - cdabel
1
确实是这样。无论如何,我正在创建一个MySQLToS3Operator:https://github.com/apache/airflow/pull/6670 如果您现在需要它,并且不想等待发布,您可以将操作员代码复制到您的airflow安装中(它完全可用)。 - Javier Lopez Tomas

网页内容由stack overflow 提供, 点击上面的
可以查看英文原文,
原文链接