我正在使用Python解析传入的逗号分隔字符串。之后我想对数据进行一些计算。字符串长度为800个字符,有120个逗号分隔字段。需要处理1.2百万个这样的字符串。
for v in item.values():
l.extend(get_fields(v.split(',')))
#process l
get_fields使用operator.itemgetter()从120个字段中提取约20个字段。
整个操作需要大约4-5分钟,不包括获取数据的时间。在程序的后半部分,我将这些行插入到sqlite内存表中以供进一步使用。但是,仅仅解析和获取列表就需要4-5分钟的时间,这对我的项目来说并不好。
我在大约6-8个线程中运行此处理过程。
转换为C/C++会有帮助吗?