我一直在本地使用dplyr,发现它是一个非常强大的工具。在许多介绍性演讲中,展示了如何使用聚合函数summarize、mutate等只对所需数据进行操作,从而作用于数据库表格。我了解它如何将这些函数转换为SQL语句,但不太了解其他操作。
例如,如果我想将数据库表作为tbl来处理,并希望通过do()对管道结果运行glm等函数,那么glm是否会以某种方式被传输到数据库中执行,或者必须下载数据(以任何简化形式),然后在本地运行glm?
根据所涉及的表格大小,这是一个重要的区别。谢谢!
例如,如果我想将数据库表作为tbl来处理,并希望通过do()对管道结果运行glm等函数,那么glm是否会以某种方式被传输到数据库中执行,或者必须下载数据(以任何简化形式),然后在本地运行glm?
根据所涉及的表格大小,这是一个重要的区别。谢谢!