gc() 和 rm() 有什么区别？

Question

92

我通过调用 rm(list=ls()) 定期清理 R 中的内存。
这之后，我需要调用垃圾回收器 gc() 吗？

这两个函数有什么区别？gc() 是否会针对某些变量调用 rm()？

- RockScience

3个回答

2

感谢ThankGoat在gc惩罚方面的评论，尽管这是真的，但人们当然可以决定在循环中每N次迭代调用gc（其中N可以以多种方式参数化）。对于迭代次数较多但给定迭代内资源使用较为适度的循环，可能不需要每次迭代都进行GC以恢复所需的性能。

当然，如果您正在进行具有非常高使用率迭代次数的循环，则情况就不同了，但此时可能需要将代码简单向量化并/或甚至使用另一种语言编写。

- Pascoe

2

个人喜欢在循环中包含gc()以释放一些RAM，当循环开始填充可用空间时。像这样：

for(i in 1:1000){
res[[i]] = some operation
gc()
}

- Gabriel123

27

请注意，调用gc()会带来大约100毫秒的巨大性能损失。因此，在这种情况下，您的代码将比必要的多运行大约100秒 :) - ThankGoat

网页内容由stack overflow 提供, 点击上面的

可以查看英文原文，
原文链接

- David Robinson · Accepted Answer

首先，需要注意的是这两者非常不同。使用gc时并不会删除你仍在使用的任何变量，它只释放那些你无法访问到的内存（无论是使用rm()移除的还是在函数中创建后已经被返回）。运行gc()永远不会使你丢失变量。

然而，在调用rm()之后是否应该调用gc()是一个很好的问题。gc的文档非常有帮助地指出：

调用gc将导致进行垃圾回收。这也会自动进行而无需用户干预，调用gc的主要目的是报告内存使用情况。

然而，在删除大型对象后调用gc可能会有所帮助，因为这可能会促使R将内存返回给操作系统。

因此，答案是可以调用gc()（至少不会有坏处），即使它可能很快就会被触发（如果不是立即触发，那么很快也会触发）。