我已成功使用 RPostgreSQL 在 R(rstudio)中访问并查询了 Amazon Redshift。
drv <- dbDriver("PostgreSQL")
con <- dbConnect(drv, host="****.redshift.amazonaws.com", port=5439,dbname="***", user="***", password="****")
接下来,我可以使用以下命令运行查询:
dbGetQuery(con,"SELECT DISTINCT(vin) FROM rawdata")
虽然我的查询不需要太长时间就可以运行,但将文件保存到个人计算机上却需要较长时间。我认为将我生成的 .csv 文件保存到 Amazon S3 存储桶会更快。我已经设置好了存储桶,只是不知道如何在 R studio 中完成操作。
我已经通过以下代码在 SQL Workbench 中访问了我的 S3 存储桶:
UNLOAD
('SELECT * FROM rawdata
ORDER BY timestamp')
TO 's3://data-**-**/file_name'
credentials '***'
delimiter ','
PARALLEL OFF
GZIP;
我想在Rstudio(版本0.98.109)中实现类似的功能。有没有人有示例代码,可能带有样本SQL查询?我可以在SQL Workbench中运行它,但我更喜欢在Rstudio中运行嵌入其他代码的SQl查询。
谢谢!