120得票8回答
按组选择第一行。

从类似这样的数据框开始test <- data.frame('id'= rep(1:5,2), 'string'= LETTERS[1:10]) test <- test[order(test$id), ] rownames(test) <- 1:10 > test ...

75得票4回答
在同一个调用中总结所有组值和条件子集

我将用一个例子来阐述我的问题。 样本数据: df <- data.frame(ID = c(1, 1, 2, 2, 3, 5), A = c("foo", "bar", "foo", "foo", "bar", "bar"), B = c(1, 5, 7, 23, 54, ...

23得票3回答
如果只能在本地机器上操作,如何最好地使用R和SQL?

我试图改进我的工作流程,希望社区能提供见解,因为我相对于“大数据”还比较新。 通常我会从公共来源下载几个互相关联的数据框。在拉出多个数据框之后,在对我的最终数据集进行回归分析和/或其他推断统计之前,我会执行各种数据处理步骤(例如过滤、排序、聚合、自定义计算)。 具体来说,你推荐哪种策略: ...

22得票4回答
如何在不耗尽内存的情况下合并两个巨大的数据框(data-frame)?

我有两个数据框df1和df2,每个数据框大约有1000万行和4列。我使用RODBC/sqlQuery在R中读入它们没有问题,但是当我尝试合并它们时,出现了最令人头疼的R错误信息:cannot allocate memory。肯定有更有效的方法来更高效地进行rbind - 有人想分享一下他们喜欢...

15得票2回答
使用sqldf和RPostgreSQL的结合

当使用RPostgreSQL时,我发现无法以相同的方式使用sqldf。例如,如果我加载库并使用以下代码将数据读入数据框:library(RPostgreSQL) drv <- dbDriver("PostgreSQL") con <- dbConnect(drv, host="lo...

13得票2回答
在R中类似SQL的功能

我习惯于使用SQL编写数据操作逻辑,现在我正在学习R语言,有时候只是想执行在SQL中简单的操作,但是为了在R数据框上进行相同的操作,我必须学习许多与R相关的知识。是否有一个简单的解决方法?

11得票3回答
如何将R变量传递到sqldf中?

我有一个查询像这样:sqldf("select TenScore from data where State_P = 'AndhraPradesh'") 但是我有一个变量stateValue,其中包含 "AndhraPradesh"。我该如何在R中使用这个变量来执行选择查询,以获得与上述相同的...

11得票4回答
错误:在 R 中的 sqldf 包中不能将 NA 传递给 dbQuoteIdentifier()。

Error: Cannot pass NA to dbQuoteIdentifier() 此外:警告信息:In field_types[] <- field_types[names(data)] : number of items to replace is not a multip...

10得票2回答
使用R中的sqldf时无法连接到数据库

我将一个csv文件加载到了R中,当我尝试使用sqldf选择某些列时,它总是失败了。 Error in .local(drv, ...) : Failed to connect to database: Error: Access denied for user 'User'@'l...

9得票1回答
sqldf:将时间戳从本地时间更改为GMT/UTC

在我的电脑上,sqldf将POSIXct从本地时间(我在CST,GMT -0600)更改为GMT / UTC。这是预期的行为吗?我能停止R或sqldf这样做吗?这是我的代码: > library('sqldf') > > before <- data.frame(c...