我目前可以通过beeline
CLI访问Apache Hive数据库。我们正在与IT商议将R
安装在服务器上。在此期间,我想要 (滥用)R
dbplyr
包在另一台机器上生成SQL查询语句,将它们复制过来,并作为原始SQL运行。在以前,我使用过sql_render
来处理有效的数据库连接,但我不知道如何在没有有效的数据库连接的情况下这样做。对我来说,理想情况是:
con <- dummy_connection('hive') # this does not exist, I think
qry <- tbl(con,'mytable') %>% # complex logic to build a query
select(var1,var2) %>%
filter(var1 > 0) # etc...
sql_render(qry) %>% # cat it to a file to be used on another machine.
as.character() %>%
cat()
有没有一种方法可以建立这个“dummy”连接?而且,是否可以以这样的方式执行,以便我可以指定SQL的变量?
sqldf
包来进行实践性的sql
查询呢? - MKRdplyr
和dbplyr
,不太想写SQL,这也是这里的重点。除非我误解了你的意思。你是不是想让我使用sqldf
来创建一个模拟数据库,就像在sqlite中一样? - steveo'america