Superset 的官方指导:
https://superset.apache.org/docs/databases/athena
awsathena+rest://{aws_access_key_id}:{aws_secret_access_key}@athena.{region_name}.amazonaws.com/{schema_name}?s3_staging_dir={s3_staging_dir}&...
你需要自己进行一些调整。在2021年12月12日阅读了许多帖子后,这对我有用:
awsathena+rest://{secret id}:{secret access key}@athena.ap-southeast-1.amazonaws.com/test?s3_staging_dir=s3://{your bucket where Athena query result is stored}/test/&work_group=primary
请注意,在我的示例中:
"schema_name = test":
在此时,您必须在Athena \查询编辑器\数据库下看到名为“test”的数据库。它是通过Glue控制台\数据目录\数据库使用爬虫或手动创建的。
s3://{您的存储桶}/{路径(如果需要)}/test:
您需要前往 Athena 工作组,选择一个工作组并检查设置是否打开了“查询结果位置”。在我的情况下,工作组的名称是“primary”,“test”数据库的查询结果将存储在 s3://{您存储 Athena 查询结果的存储桶}/test/ 中。
请确保已在 Python 虚拟环境下安装以下内容::
pip install "PyAthenaJDBC>1.0.9"
pip install "PyAthena>1.2.0"
了解如何在Python环境下创建Superset:
https://superset.apache.org/docs/installation/installing-superset-from-scratch
安全组:
我从这里得到了指令:https://www.youtube.com/watch?v=vzuPQPRcT-0
我在EC2实例上构建了Superset。因此,您需要检查安全组设置。因为它涉及到EC2服务、Athena服务和运行UI中的Superset的网站。
在我的情况下,我已经打开了所有这些设置,以确保第一次可以运行。然后您可以缩小设置范围。
自定义TCP - TCP - 8088 - ::/0 ; 0.0.0.0/0
HTTP - TCP - 80 - ::/0 ; 0.0.0.0/0
SSH - TCP - 22 - ::/0 ; 0.0.0.0/0
自定义ICMP - IPv4 - 回显请求 - N/A - 0.0.0.0/0
所有ICMP - IPv6 - IPv6 ICMP - 所有 - ::/0
所有ICMP - IPv6 - IPv6 ICMP - 所有 - 0.0.0.0/0
pip install
命令?我已经在EC2实例上安装了Superset,并通过端口进行访问。 - Debapratim Chakraborty