我的matlab知识只是基于需要而已,所以这可能是一个初级问题。无论如何,问题来了:
我有一个包含以二进制格式存储的数据(16位整数)的文件。 我该如何在matlab中将其读入矢量/数组中? 我该如何在matlab中将这些数据写入文件? 在读取/写入大量数据(千兆字节)时有没有什么聪明的技巧来提高性能速度?
正如Bill the Lizard所说,你可以使用fread将数据加载到向量中。我只想在他的回答上稍作扩展。
>> fid=fopen('data.bin','rb') % opens the file for reading
>> A = fread(fid, count, 'int16') % reads _count_ elements and stores them in A.
命令fopen和fread默认使用小端[1]编码来处理整数。如果您的文件使用大端编码,则需要将fread更改为
>> A = fread(fid, count, 'int16', 'ieee-be');
此外,如果您想阅读整个文件集
>> count=inf;
如果您想将数据读入具有n列的矩阵中,请使用以下代码:
and if you want to read the data into matrix with n columns use
>> count=[n inf];
关于将数据写入文件。在Bill的回答中,命令fwrite将写入二进制文件。如果要将数据写入文本文件,则可以使用dlmwrite。
>> dlmwrite('data.csv',A,',');
[1] http://en.wikipedia.org/wiki/Endianness
在Matlab的fopen或fread命令中可以指定二进制数据的机器格式(例如ieee-be,ieee-le,vaxd等)。支持的机器格式的详细信息可以在Matlab的fopen文档中找到。
Scott French在Bill的回答下的评论建议将数据读入int16变量中。要做到这一点,请使用:
>> A = int16(fread(fid,count,precision,machineFormat));
其中count表示要读取的数据的大小/形状,precision表示数据格式,machineformat表示每个字节的编码方式。
查看命令fseek以在文件中移动。例如,
>> fseek(fid,0,'bof');
将文件倒回到开头,其中bof代表文件开头。
假设您知道文件中存储了多少值,您可以像这样将数据读入数组中。
fid = fopen('data.bin','rb')
A = fread(fid, count, 'int16')
要将数据写入文件,请执行以下操作:
fid = fopen('data.bin','w')
count = fwrite(fid, A, 'int16')
fwrite函数返回写入文件的元素数量(而不是字节数)。
在性能调优方面,您可以按块读取数据,只使用所需处理的数据量。这在任何语言中都适用,并且没有特定于Matlab的加速方法。
我通常不喜欢在回复中看到链接,但是这个看起来相当接近:
http://www.mathworks.com/support/tech-notes/1400/1403.html
关于性能调优的第二部分,我已经6年没有使用Matlab了,所以不清楚。