我试图序列化一个大型列表(约10**6行,每行包含约20个值),以便稍后由自己使用(因此pickle的安全性不成问题)。
列表的每一行都是一组值的元组,这些值来自某个SQL数据库。到目前为止,我看到过datetime.datetime
、字符串、整数和NoneType,但我可能最终还需要支持其他数据类型。
对于序列化,我考虑了pickle(cPickle)、json和纯文本——但只有pickle保存了类型信息:json无法序列化datetime.datetime
,而纯文本具有其明显的缺点。
但是,对于这么大的数据,cPickle的速度相当慢,我正在寻找更快的替代方法。