我试图使用简单文本分类器进行一些有监督的实验,但在使用Sklearn
中的K Fold
生成器时遇到了内存问题。我收到的错误信息是:"Your system has run out of application memory",但我的数据集只有约245K行x81K列。虽然有点大,但并不是很巨大。程序从未终止,而是一直“挂起”,直到我手动关闭终端应用程序。我让它这样运行了约30分钟,没有任何进展。
我还编写了print
语句,以查看代码在交叉验证循环的哪个位置被卡住了。看起来已经生成了训练和测试集的索引,但代码从未到达使用这些索引切片实际的特征和标签的训练和测试集的点。我正在运行这个程序的Macbook Pro上,它运行的是10.9.5操作系统。我尝试过关闭除Terminal应用程序之外的所有其他应用程序,但没有成功。还有其他人遇到过这种问题吗?还是这可能是我的机器上出现的特定问题?
编辑:我使用10倍和5倍交叉验证运行了此程序,并且每次都遇到了同样的问题。