我有一个需要在每次循环中向文件写入数据的长循环。问题是,写入文件可能很慢,因此我希望通过异步写入来减少这个过程所需的时间。
有人知道好的方法吗?我应该创建一个线程来消耗写入缓冲区的任何内容(在这种情况下,单一生产者,单一消费者)吗?
我主要感兴趣的解决方案都不涉及除C++11标准库之外的任何东西。
我有一个需要在每次循环中向文件写入数据的长循环。问题是,写入文件可能很慢,因此我希望通过异步写入来减少这个过程所需的时间。
有人知道好的方法吗?我应该创建一个线程来消耗写入缓冲区的任何内容(在这种情况下,单一生产者,单一消费者)吗?
我主要感兴趣的解决方案都不涉及除C++11标准库之外的任何东西。
在涉及异步写入之前,如果您正在使用IOStreams,则可能希望尝试避免意外刷新流,例如通过不使用std::endl
而是使用'\n'
。由于向IOStreams写入是有缓冲的,这可以大大提高性能。
如果这还不够,下一个问题是如何编写数据。如果进行了很多格式化操作,实际格式化可能占据了大部分时间。您可能能够将格式化推迟到单独的线程中,但这与仅将几个字节传递到另一个线程有很大区别:您需要传递一个包含要格式化的数据的合适数据结构。具体适合什么可能取决于您实际编写的内容。
最后,如果将缓冲区写入文件真的成为瓶颈,并且您想坚持使用标准C++库,那么可能有一个编写器线程,它侦听来自适当流缓冲区的缓冲区填充的队列,并将这些缓冲区写入std::ofstream
中:生产者接口将是发送固定大小的缓冲区,当缓冲区已满或流被刷新时(我会明确使用std::flush
)到另一个读取侦听的队列上的std::ostream
。以下是仅使用标准库设施对该想法的快速实现:
#include <condition_variable>
#include <fstream>
#include <mutex>
#include <queue>
#include <streambuf>
#include <string>
#include <thread>
#include <vector>
struct async_buf
: std::streambuf
{
std::ofstream out;
std::mutex mutex;
std::condition_variable condition;
std::queue<std::vector<char>> queue;
std::vector<char> buffer;
bool done;
std::thread thread;
void worker() {
bool local_done(false);
std::vector<char> buf;
while (!local_done) {
{
std::unique_lock<std::mutex> guard(this->mutex);
this->condition.wait(guard,
[this](){ return !this->queue.empty()
|| this->done; });
if (!this->queue.empty()) {
buf.swap(queue.front());
queue.pop();
}
local_done = this->queue.empty() && this->done;
}
if (!buf.empty()) {
out.write(buf.data(), std::streamsize(buf.size()));
buf.clear();
}
}
out.flush();
}
public:
async_buf(std::string const& name)
: out(name)
, buffer(128)
, done(false)
, thread(&async_buf::worker, this) {
this->setp(this->buffer.data(),
this->buffer.data() + this->buffer.size() - 1);
}
~async_buf() {
std::unique_lock<std::mutex>(this->mutex), (this->done = true);
this->condition.notify_one();
this->thread.join();
}
int overflow(int c) {
if (c != std::char_traits<char>::eof()) {
*this->pptr() = std::char_traits<char>::to_char_type(c);
this->pbump(1);
}
return this->sync() != -1
? std::char_traits<char>::not_eof(c): std::char_traits<char>::eof();
}
int sync() {
if (this->pbase() != this->pptr()) {
this->buffer.resize(std::size_t(this->pptr() - this->pbase()));
{
std::unique_lock<std::mutex> guard(this->mutex);
this->queue.push(std::move(this->buffer));
}
this->condition.notify_one();
this->buffer = std::vector<char>(128);
this->setp(this->buffer.data(),
this->buffer.data() + this->buffer.size() - 1);
}
return 0;
}
};
int main()
{
async_buf sbuf("async.out");
std::ostream astream(&sbuf);
std::ifstream in("async_stream.cpp");
for (std::string line; std::getline(in, line); ) {
astream << line << '\n' << std::flush;
}
}
stream.rdbuf()->setbuf(0, 0)
来禁用文件流的缓冲区。 - Dietmar Kühloverflow()
[基于流所知道的:还有一个字符空间可以将参数粘贴到overflow()
中]。如果您想在缓冲区未满的情况下发送数据,则需要进行flush
操作(当流被销毁时,它将进行flush
操作)。上面的实现将数据分成128字节的单元。当然,常量可以更改(我还没有对代码进行分析,以确定哪个大小最合适)。 - Dietmar Kühloverflow()
中增加缓冲区大小,并仅在显式刷新时发送它(即调用sync()
时)。 - Dietmar Kühl在网上搜索“双缓冲”。
一般来说,一个线程将写入一个或多个缓冲区。另一个线程从缓冲区中读取,“追踪”写入线程。
这可能不会使您的程序更有效率。对于文件而言,通过以巨大的块写入文件来实现效率,这样驱动器就不会有机会停转。一次写入多个字节比多次写入少量字节更有效率。
这可以通过仅当缓冲区内容超过1k的某个阈值时,写入线程才进行写入来实现。
还要研究“打印流程”或“打印流程池”的主题。
需要使用C++11,因为之前的版本没有标准库中的线程支持。我不知道为什么限制自己,因为Boost中有一些很好的东西。