我正在尝试合并一个大文件和一个小文件,但卡住了。我阅读了许多有关R内存管理的文章(点击此处) (点击此处),但没有找到非极端的解决方法(如转为64位,上传到集群等)。我尝试使用bigmemory包,但未能找到解决方案。在我绝望之前,我想在这里尝试一下。 我运行的代码类似于以下内容:
我想问一下,是否有任何聪明的方法可以解决这个问题,而不需要购买新的硬件?
非常感谢任何指导。
详情:R版本2.13.1(2011-07-08)平台:i386-pc-mingw32 / i386(32位)Intel 2 Duo Core @ 2.33GHz,3.48GB RAM
#rm(list=ls())
localtempdir<- "F:/Temp/"
memory.limit(size=4095)
[1] 4095
memory.size(max=TRUE)
[1] 487.56
gc()
used (Mb) gc trigger (Mb) max used (Mb)
Ncells 170485 4.6 350000 9.4 350000 9.4
Vcells 102975 0.8 52633376 401.6 62529185 477.1
client_daily<-read.csv(paste(localtempdir,"client_daily.csv",sep=""),header=TRUE)
object.size(client_daily)
>130MB
sbp_demos<-read.csv(paste(localtempdir,"sbp_demos",sep=""))
object.size(demos)
>0.16MB
client_daily<-merge(client_daily,sbp_demos,by.x="OBID",by.y="OBID",all.x=TRUE)
Error: cannot allocate vector of size 5.0 MB
我想问一下,是否有任何聪明的方法可以解决这个问题,而不需要购买新的硬件?
- 我需要能够合并以创建更大的对象。
- 然后我将需要对该更大的对象进行回归等操作。
非常感谢任何指导。
详情:R版本2.13.1(2011-07-08)平台:i386-pc-mingw32 / i386(32位)Intel 2 Duo Core @ 2.33GHz,3.48GB RAM
data.table
包吗?对于大型合并,它非常快速,并且巧合的是可能更加内存高效? - Chase