在gnuplot中从一个非常大的文件中绘制子图

Question

在gnuplot中从一个非常大的文件中绘制子图

3

我有一个包含几十亿条数据的10GB文件。其中有很多列。我想将每一列绘制成不同的子图。我使用了以下的最小工作示例：

set datafile separator ","
set terminal png
set output "a.png"
set multiplot layout 2,1 title ""
plot "camkii.dat" using 1:2 with lines
plot "camkii.dat" using 1:23 with lines

此脚本需要几十秒钟时间。正如您所看到的，我两次调用了plot "camkii.dat" ...。我怀疑每次都读取文件。这不太高效，而且我可能会耗尽内存。

如果我可以将文件读入某个变量（比如说foo），然后使用变量foo绘制每个子图。类似于plot foo[1] ...和plot foo [2] ...等。那么我只需一次读取文件。

我怀疑gnuplot可能正在两次加载文件。如果是这样，将文件保存到变量中并绘制它是否有帮助？对MWE建议的更改将非常有帮助。

- Dilawar

不，您不能缓存数据以便在第二个图中重复使用。如果您的数据量太大而无法处理，可以尝试使用更高效的方式来保存您的数据，例如hdf5文件格式。然后，您可以使用例如“h5totxt”来提取所需的数据部分，而不必读取整个文件。这只是一个猜测，我还没有进行过基准测试。 - Christoph

1个回答

网页内容由stack overflow 提供, 点击上面的

可以查看英文原文，
原文链接

- Raphael Roth · Accepted Answer

我猜整个文件被读取了两次，但我不确定。如果你在Linux系统上，可以使用awk来提取所需的列（但第一列再次被读取）。

plot "<awk '{print $1 $2}' camkii.dat" with lines     
plot "<awk '{print $1 $23}' camkii.dat" with lines