我们正在尝试在一个相当大的数据集上(约1.4亿行)使用gbm包进行实验,在R的内存要求方面遇到了问题。
我们已经尝试使用'gbm'和'bigmemory'这两个包进行组合,但没有成功,接下来我们想修改C++源代码,从本地数据库中获取存储在其中的数据集。
因此,我们想知道是否有更适合或者更为常见的做法来改变gbm C++代码中的分配方式。是否有人尝试过类似的操作?
我们正在尝试在一个相当大的数据集上(约1.4亿行)使用gbm包进行实验,在R的内存要求方面遇到了问题。
我们已经尝试使用'gbm'和'bigmemory'这两个包进行组合,但没有成功,接下来我们想修改C++源代码,从本地数据库中获取存储在其中的数据集。
因此,我们想知道是否有更适合或者更为常见的做法来改变gbm C++代码中的分配方式。是否有人尝试过类似的操作?
R
分配更多的RAM(或以某种方式更有效地利用RAM),而不是任何统计问题。 - whuber