如何序列化CSR矩阵

3

我有一个从TfidfTransformer.transform计算出来的csr_matrix对象。 我想要序列化和反序列化:

tf_csrmtrix = TfidfTransformer.transform(data)
json.dumps(tf_csrmtrix)
TypeError: Object of type 'csr_matrix' is not JSON serializable

我该如何处理这种数据:csr矩阵?

1
它必须是JSON吗?或者完全可读的格式?还是二进制序列化就可以了? - Adam.Er8
应该进行二进制/字符串序列化。 - Agus
1个回答

0
如果二进制序列化格式可以解决问题,我建议使用pickle模块
只需import pickle并在使用json.dumps的地方使用pickle.dumps(请注意,这会生成一个字节对象,而不是像json一样的字符串)。
您应该能够将其写入文件、数据库或某些套接字,并稍后使用pickle加载它,以获取完全相同的对象。

网页内容由stack overflow 提供, 点击上面的
可以查看英文原文,
原文链接