Apache Drill可以连接到Amazon RedShift吗?

4
Apache Drill可以连接到Amazon Redshift吗?如果可以,有没有人能帮我配置和插件以便Apache Drill可以连接到Amazon Redshift。

1
这个问题似乎不属于编程或开发范畴,因此它可能适合于 Stack Exchange 网络中的另一个站点。也许你应该尝试 Super User 或 Unix & Linux Stack Exchange。此外,要求书籍、工具、软件库、教程或其他站外资源推荐的问题在 Stack Overflow 上是不被允许的,因为它们往往会吸引主观的答案和垃圾邮件。 - jww
2个回答

2

我无法让@pavel提供的示例正常工作,我确信这与驱动程序名称以及我下载和安装的特定驱动程序有关。

但是,我成功地使用以下步骤连接到了AWS Redshift。

导航到您已经下载Drill的文件夹:

cd ~/Downloads/apache-drill-1.11.0 

请从AWS的Amazon Redshift JDBC Driver下载所需的jdbc驱动程序。

将jar文件保存到文件夹~/Downloads/apache-drill-1.11.0/jars/3rdparty中。

使用以下命令启动drill:

./bin/drill-embedded 

导航到 http://localhost:8047/storage 来配置一个新的数据源插件。
创建一个新的存储插件,并将你的数据源命名为相应的名称。例如,我将其命名为 “redshift”。
一旦你把数据源命名为 "redshift",就可以粘贴正确的配置信息了。
{
  "type" : "jdbc",
  "driver" : "com.amazon.redshift.jdbc42.Driver",
  "url" : "jdbc:redshift://redshiftserver.mydomain.net:5439/databaseName?ssl=true&sslfactory=com.amazon.redshift.ssl.NonValidatingFactory",
  "username" : "username",
  "password" : "password",
  "enabled" : true
}

下一步是使用以下查询测试与服务器的连接。
select * from redshift.autonation.information_schema.columns

有一件事情让我困扰,那就是关于表的限定名称。假设您将连接命名为 redshift,那么查询语句将会是:redshift.<database_name>.<schema_name>.<table_name>,只有这样,您的查询才能够正常工作。 - rhmiller_ic

1

使用示例-Postgres-配置即可。

然后使用Web界面添加存储:

{
  "type" : "jdbc",
  "driver" : "org.postgresql.Driver",
  "url" : "jdbc:postgresql://URL:5439/DB_NAME_HERE",
  "username" : "user",
  "password" : "password",
  "enabled" : true
}

网页内容由stack overflow 提供, 点击上面的
可以查看英文原文,
原文链接