为什么ostringstream比ofstream更快？

Question

为什么ostringstream比ofstream更快？

11

为了将许多数据写入文件，我有两种方法：

直接逐个将数据写入 ofstream

ofstream file("c:\\test.txt");
for (int i = 0; i < 10000; ++i)
{
    file << data[i];
}

先将数据写入istringstream，然后一次性将其写入ofstream

ostringstream strstream;
for (int i = 0; i < 10000; ++i)
{
    strstream << data[i];
}
ofstream file("c:\\test.txt");
file << strstream.str();

- Baiyan Huang

3个回答

5

磁盘速度较慢。许多小的写操作比一个大的写操作更加耗费资源。

- Erik

但是这应该通过缓冲来避免。 - sbi

1

ofstream不会无限制地缓冲，它将在内部缓冲区达到一个阈值时进行写操作。 - Erik

你知道 threshold 是什么吗？有任何参考资料吗？从这个 API 描述来看，如果内存不够，它似乎会增加内存。 - Baiyan Huang

@lzprgmr：抱歉，我不知道，我相信这取决于实现。sbi的答案展示了如何更改它。 - Erik

2

可能是特定操作系统的实现问题。我猜想 ofstream 缓冲区长度 (buflen) 小于 10000，一个典型值为 4095。因此，请尝试使用 i<4096 运行，响应时间应该相同！

第二种情况下更快的原因在于：

在第一种情况下，当缓冲区已满 (buflen=4095bytes) 时，数据将被写入磁盘。因此，在 i<10000 的情况下，它将被刷新 3 次。

而在第二种情况下，所有数据首先准备在 RAM 中，并一次性刷新到硬盘中。因此，节省了两次刷新！

- user5858

网页内容由stack overflow 提供, 点击上面的

可以查看英文原文，
原文链接

- sbi · Accepted Answer

你是否频繁使用 std::endl 而不是 '\n'？std::endl 实际上执行了两个操作，首先将一个 '\n' 插入流中，然后刷新缓冲区到磁盘。我曾经看到这样的代码性能严重下降。（修复后代码运行速度提高了5-10倍）
将缓冲区刷新到字符串缓冲区会比刷新到磁盘快得多，因此这可能解释了你的发现。

如果并非如此，请考虑增加缓冲区的大小：

const std::size_t buf_size = 32768;
char my_buffer[buf_size];
ofstream file("c:\\test.txt");
file.rdbuf()->pubsetbuf(my_buffer, buf_size);

for (int i = 0; i < 10000; ++i)
{
    file << data[i];
}