从Hive执行R脚本

3
有人知道如何将数据从Hive读取到R中,再将其返回到Hive吗?
我可以用Python很容易地做到这一点,就像这样:
for line in sys.stdin:

  Some code ...

  sys.stdout.write(Output + '\n') 

有没有类似的R语言实现方式?谢谢,Tomer。

您可能对此问题的答案和评论感兴趣:https://dev59.com/sWkw5IYBdhLWcg3wdKbD - agstudy
我只是好奇为什么标题是“执行...”。什么被执行了?我试图将其更改为“读取Windows hive中的数据”,但更改被拒绝了。 - Dieter Menne
我猜它被拒绝是因为其中的“Windows”部分。这与Windows无关。 - Ken Williams
2个回答

0
Ofir,我猜你可以用R以相同的方式编写代码。 具体来说:
conn <- file("stdin", open="r")
while (length(next.line <- readLines(conn, n=1, warn=FALSE)) > 0) { 
    # processing
    cat(output)
}

0

如果您在Hive服务器上安装了Rstudio,您可以通过R脚本轻松访问它。您需要使用Rhive包。 http://cran.r-project.org/web/packages/RHive/

之后,您只需要在R配置文件中设置Hadoop和Hive主目录的路径, 然后使用即可。

library(Rhive)
rhive.init()
rhcon<-rhive.connect(address,port=)

希望这能帮到你!


网页内容由stack overflow 提供, 点击上面的
可以查看英文原文,
原文链接