检查两个scipy.sparse.csr_matrix是否相等。

33
我希望检查两个csr_matrix是否相等。
如果我这样做:
x.__eq__(y)

我得到:
raise ValueError("The truth value of an array with more than one "
ValueError: The truth value of an array with more than one element is ambiguous. Use a.any() or a.all().

然而,这个很好用:

assert (z in x for z in y)

有没有更好的方法来做这个?也许可以使用一些scipy优化函数来代替?

非常感谢。


你尝试过(x==y).all()吗?只是猜测... - Christian K.
3
==all不适用于稀疏矩阵的实际计算。大多数元素都是0。x==x会产生一个全为True的矩阵,这不再是稀疏矩阵。 - hpaulj
3个回答

48

我们可以假设它们是相同的形状吗?

In [202]: a=sparse.csr_matrix([[0,1],[1,0]])
In [203]: b=sparse.csr_matrix([[0,1],[1,1]])
In [204]: (a!=b).nnz==0   
Out[204]: False

这个函数检查不等式数组的稀疏性。

如果尝试使用a==b(至少第一次使用)会收到效率警告。那是因为它必须测试所有这些零。 它不能充分利用稀疏性。

您需要一个相对较新的版本才能使用像这样的逻辑运算符。您是在某个if表达式中尝试使用x.__eq__(y),还是仅从该表达式中获得错误?

通常,您可能需要先检查几个参数。相同的shape,相同的nnz,相同的dtype。对于浮点数,您需要小心。

对于密集数组,np.allclose是测试相等性的好方法。 如果稀疏数组不太大,那也可能是很好的方法。

np.allclose(a.A, b.A)

allclose 使用 all(less_equal(abs(x-y), atol + rtol * abs(y)))。你可以使用 a-b,但我怀疑这也会产生效率警告。


我能得到的最好的技巧,谢谢! - AvidLearner
3
我想知道为什么numpy.array_equal对于两个稀疏输入似乎不能按预期工作? - ely
4
一个 Scipy 稀疏矩阵不是一个 np.ndarray,它是一个完全不同的对象类,它将其数据存储在数组中。尝试使用 np.asarray(M) 来获取一个小样本矩阵并查看结果。同时查看 np.array_equal 的代码(它是 Python 语言)。通常情况下,numpy 函数无法应用于稀疏矩阵。 - hpaulj

1

0
我建议使用以下方法进行快速比较。但是,这需要两个矩阵都有排序的索引(通过.sort_indices())。
(len(x.indices) == len(y.indices)
    and np.all((x.indices - y.indices) == 0)
    and np.allclose((x.data - y.data), 0)

网页内容由stack overflow 提供, 点击上面的
可以查看英文原文,
原文链接