我正在寻找一种高效的(在计算机资源和学习/实现方面都高效)方法来合并两个较大的数据框(大小> 1百万 / 300 KB RData文件)。
基于R的"merge"和plyr中的"join"似乎会有效地使用所有内存,导致系统崩溃。
示例:
加载测试数据框并尝试执行以下操作:
test.merged<-merge(test, test)
或者test.merged<-join(test, test, type="all")
-
-
以下文章提供了一个合并和替代列表:
如何在R中连接(合并)数据框(inner、outer、left、right)?
以下允许对象大小检查:
https://heuristically.wordpress.com/2010/01/04/r-memory-usage-statistics-variable/
由anonym产生的数据。