我收集了几MB的网络流量数据并想对其进行分析。我面临的问题是,我希望以一种可以减少搜索时间复杂度的方式存储它。
我最初的想法是将其放入数据库中,并在列中使用所有可能的属性,但后来我意识到表中会有很多空值,这会降低数据库的性能。即使对于小型数据库,性能下降也很小,当我解析大的*.pcap文件(大于1GB)时,性能下降会严重影响数据库的性能。随着数据库的大小增加和表中空值的数量增加,性能下降会更加明显。
那么是否有更好的方法来存储*.pcap文件以进行分析?我一直在研究XML树作为解决方案,但我不确定。我正在使用Python进行操作,并使用dpkt模块从*.pcap文件中提取数据。
提前感谢您的帮助!
我最初的想法是将其放入数据库中,并在列中使用所有可能的属性,但后来我意识到表中会有很多空值,这会降低数据库的性能。即使对于小型数据库,性能下降也很小,当我解析大的*.pcap文件(大于1GB)时,性能下降会严重影响数据库的性能。随着数据库的大小增加和表中空值的数量增加,性能下降会更加明显。
那么是否有更好的方法来存储*.pcap文件以进行分析?我一直在研究XML树作为解决方案,但我不确定。我正在使用Python进行操作,并使用dpkt模块从*.pcap文件中提取数据。
提前感谢您的帮助!