我有一个稀疏矩阵 X
<1000000x153047 sparse matrix of type '<class 'numpy.float64'>'
with 5082518 stored elements in Compressed Sparse Column format>
我有一个数组
columns_to_use
这段代码涉及到矩阵X的10000个列的id。我只想使用这些列而删除其他列。我尝试使用以下代码:
X_new = X[:, columns_to_use]
当数据量较小(10,000行)时,这种方法可以很好地运作。但是,当数据量达到100,000行或以上时,会出现内存错误。如何在不出现内存错误的情况下获取特定列?