我正在将一些旧的文本日志转换成Python可用的格式。由于文件非常大,所以我正在编写自己的C扩展程序,尽可能快地运行并使用正则表达式解析出相关字段。我的最终目标是将这些字段导出到
我打算使用
NumPy
数组中的strings
。我知道可以在C中创建NumPy
数组作为PyObject
,然后对每个元素调用SetItem
,但我想尽可能进行优化。
我能否像使用memcpy
或PyBuffer_FromMemory
这样的东西直接将C字符串读入NumPy
string
数组中?我理解NumPy
数组在内部类似于C数组,但是我是否必须确保NumPy
数组将被连续分配?我打算使用
NumPy
数组构建Pandas
列进行统计分析。据我了解,Pandas
使用NumPy
数组将列存储在DataFrame
中,因此从NumPy
到Pandas
不会有过多的开销。如果可能的话,我想避免使用cython
。