使用dplyr时,
我曾认为本地数据框指的是内存中的数据框,而非本地数据框则是像SQL这样的数据库。但我认为我的假设是错误的。在约25:25的教程视频中,Kevin Markham说
tbl_df
函数会打印一条声明,表明数据框是“本地”的:> mtcars %>%
+ group_by(gear)
Source: local data frame [32 x 11]
Groups: gear
mpg cyl ...
1 21.0 6 ...
我曾认为本地数据框指的是内存中的数据框,而非本地数据框则是像SQL这样的数据库。但我认为我的假设是错误的。在约25:25的教程视频中,Kevin Markham说
data.frame
对象不是本地数据框,而我原以为它们是。
我查看了tbl_df
文档,并在dplyr简介文档中使用搜索功能,但找不到本地数据框的描述。
问题:什么是本地数据框?
data_frame
对象是本地数据框,但data.frame
对象则不是。现在我也感到困惑了。 - stuwestprint.tbl_df
总是打印cat("Source: local data frame", ...)
,因此在这个意义上,任何数据框都是“本地的”(链接1);“本地数据框”是“远程数据源”的“相反”(链接2)。 - tonytonov