更新2 / TL;DR
有没有什么方法可以防止在关闭打开的内存映射后,将
FILE_FLAG_DELETE_ON_CLOSE
的临时文件的脏页面刷新?
有。 如果您在文件创建后不需要对文件本身进行任何操作,并且实现了一些命名约定,则可以通过 this answer 中解释的策略实现此目的。
注意: 我仍然非常想知道为什么行为会因创建映射的方式和处理/取消映射的顺序而有如此大的差异。
我一直在研究一些策略,以实现在Windows上使用“内存块”链允许增长和缩小其承诺容量的进程间共享内存数据结构。
其中一种可能的方法是使用“页面文件支持的命名内存映射”作为块内存。这种策略的优点是可以使用“SEC_RESERVE”来保留大块内存地址空间,并使用“VirtualAlloc”和“MEM_COMMIT”逐步分配它。缺点是需要拥有“SeCreateGlobalPrivilege”权限才能允许在“Global\”名称空间中使用可共享的名称,以及所有提交的内存都会对系统提交费用产生贡献。
为了避免这些缺点,我开始研究使用临时文件支持的内存映射。即使用FILE_FLAG_DELETE_ON_CLOSE | FILE_ATTRIBUTE_TEMPORARY标志组合创建的文件上的内存映射。这似乎是一种推荐策略,根据例如this blog post,应该防止将映射的内存刷新到磁盘(除非内存压力导致脏映射页面被分页出去)。
然而,我注意到,在拥有进程退出之前关闭映射/文件句柄会导致脏页面刷新到磁盘。即使视图/文件句柄不是通过这些视图打开的,也不是这些视图在页面变脏之前打开的。
似乎改变处理顺序(即首先取消映射视图或首先关闭文件句柄)对启动磁盘刷新的时间有一定影响,但对刷新发生的事实没有影响。
所以我的问题是:
- 是否有一种方法可以使用临时文件支持的内存映射,防止在关闭映射/文件时刷新脏页,考虑到一个进程中的多个线程/多个进程可能对这样的文件具有打开的句柄/视图?
- 如果没有,观察到的行为的原因是什么?
- 是否有我可能忽略的替代策略?
更新
一些额外的信息:在以下示例代码中运行“arena1”和“arena2”部分时,将它们在两个独立的进程中运行,其中“arena1”是创建共享内存区域的进程,“arena2”则打开它们。对于具有脏页的地图/块,观察到以下行为:
- 如果在“arena1”进程中关闭视图之前关闭文件句柄,则会将每个这些块刷新到磁盘上,这似乎是一个(部分)同步过程(即它会阻塞处理线程几秒钟),无论“arena2”进程是否已启动。
- 如果在视图之前关闭文件句柄,则仅对那些在“arena1”进程中关闭并且“arena2”进程仍然拥有对这些块的打开句柄的映射/块进行磁盘刷新,并且它们似乎是“异步”的,即不会阻塞应用程序线程。
请参考下面的(c++)示例代码,它允许在我的系统(x64,Win7)上重现该问题:
static uint64_t start_ts;
static uint64_t elapsed() {
return ::GetTickCount64() - start_ts;
}
class PageArena {
public:
typedef uint8_t* pointer;
PageArena(int id, const char* base_name, size_t page_sz, size_t chunk_sz, size_t n_chunks, bool dispose_handle_first) :
id_(id), base_name_(base_name), pg_sz_(page_sz), dispose_handle_first_(dispose_handle_first) {
for (size_t i = 0; i < n_chunks; i++)
chunks_.push_back(new Chunk(i, base_name_, chunk_sz, dispose_handle_first_));
}
~PageArena() {
for (auto i = 0; i < chunks_.size(); ++i) {
if (chunks_[i])
release_chunk(i);
}
std::cout << "[" << ::elapsed() << "] arena " << id_ << " destructed" << std::endl;
}
pointer alloc() {
auto ptr = chunks_.back()->alloc(pg_sz_);
if (!ptr) {
chunks_.push_back(new Chunk(chunks_.size(), base_name_, chunks_.back()->capacity(), dispose_handle_first_));
ptr = chunks_.back()->alloc(pg_sz_);
}
return ptr;
}
size_t num_chunks() {
return chunks_.size();
}
void release_chunk(size_t ndx) {
delete chunks_[ndx];
chunks_[ndx] = nullptr;
std::cout << "[" << ::elapsed() << "] chunk " << ndx << " released from arena " << id_ << std::endl;
}
private:
struct Chunk {
public:
Chunk(size_t ndx, const std::string& base_name, size_t size, bool dispose_handle_first) :
map_ptr_(nullptr), tail_(nullptr),
handle_(INVALID_HANDLE_VALUE), size_(0),
dispose_handle_first_(dispose_handle_first) {
name_ = name_for(base_name, ndx);
if ((handle_ = create_temp_file(name_, size)) == INVALID_HANDLE_VALUE)
handle_ = open_temp_file(name_, size);
if (handle_ != INVALID_HANDLE_VALUE) {
size_ = size;
auto map_handle = ::CreateFileMappingA(handle_, nullptr, PAGE_READWRITE, 0, 0, nullptr);
tail_ = map_ptr_ = (pointer)::MapViewOfFile(map_handle, FILE_MAP_ALL_ACCESS, 0, 0, size);
::CloseHandle(map_handle); // no longer needed.
}
}
~Chunk() {
if (dispose_handle_first_) {
close_file();
unmap_view();
} else {
unmap_view();
close_file();
}
}
size_t capacity() const {
return size_;
}
pointer alloc(size_t sz) {
pointer result = nullptr;
if (tail_ + sz <= map_ptr_ + size_) {
result = tail_;
tail_ += sz;
}
return result;
}
private:
static const DWORD kReadWrite = GENERIC_READ | GENERIC_WRITE;
static const DWORD kFileSharing = FILE_SHARE_READ | FILE_SHARE_WRITE | FILE_SHARE_DELETE;
static const DWORD kTempFlags = FILE_ATTRIBUTE_NOT_CONTENT_INDEXED | FILE_FLAG_DELETE_ON_CLOSE | FILE_ATTRIBUTE_TEMPORARY;
static std::string name_for(const std::string& base_file_path, size_t ndx) {
std::stringstream ss;
ss << base_file_path << "." << ndx << ".chunk";
return ss.str();
}
static HANDLE create_temp_file(const std::string& name, size_t& size) {
auto h = CreateFileA(name.c_str(), kReadWrite, kFileSharing, nullptr, CREATE_NEW, kTempFlags, 0);
if (h != INVALID_HANDLE_VALUE) {
LARGE_INTEGER newpos;
newpos.QuadPart = size;
::SetFilePointerEx(h, newpos, 0, FILE_BEGIN);
::SetEndOfFile(h);
}
return h;
}
static HANDLE open_temp_file(const std::string& name, size_t& size) {
auto h = CreateFileA(name.c_str(), kReadWrite, kFileSharing, nullptr, OPEN_EXISTING, kTempFlags, 0);
if (h != INVALID_HANDLE_VALUE) {
LARGE_INTEGER sz;
::GetFileSizeEx(h, &sz);
size = sz.QuadPart;
}
return h;
}
void close_file() {
if (handle_ != INVALID_HANDLE_VALUE) {
std::cout << "[" << ::elapsed() << "] " << name_ << " file handle closing" << std::endl;
::CloseHandle(handle_);
std::cout << "[" << ::elapsed() << "] " << name_ << " file handle closed" << std::endl;
}
}
void unmap_view() {
if (map_ptr_) {
std::cout << "[" << ::elapsed() << "] " << name_ << " view closing" << std::endl;
::UnmapViewOfFile(map_ptr_);
std::cout << "[" << ::elapsed() << "] " << name_ << " view closed" << std::endl;
}
}
HANDLE handle_;
std::string name_;
pointer map_ptr_;
size_t size_;
pointer tail_;
bool dispose_handle_first_;
};
int id_;
size_t pg_sz_;
std::string base_name_;
std::vector<Chunk*> chunks_;
bool dispose_handle_first_;
};
static void TempFileMapping(bool dispose_handle_first) {
const size_t chunk_size = 256 * 1024 * 1024;
const size_t pg_size = 8192;
const size_t n_pages = 100 * 1000;
const char* base_path = "data/page_pool";
start_ts = ::GetTickCount64();
if (dispose_handle_first)
std::cout << "Mapping with 2 arenas and closing file handles before unmapping views." << std::endl;
else
std::cout << "Mapping with 2 arenas and unmapping views before closing file handles." << std::endl;
{
std::cout << "[" << ::elapsed() << "] " << "allocating " << n_pages << " pages through arena 1." << std::endl;
PageArena arena1(1, base_path, pg_size, chunk_size, 1, dispose_handle_first);
for (size_t i = 0; i < n_pages; i++) {
auto ptr = arena1.alloc();
memset(ptr, (i + 1) % 256, pg_size); // ensure pages are dirty.
}
std::cout << "[" << elapsed() << "] " << arena1.num_chunks() << " chunks created." << std::endl;
{
PageArena arena2(2, base_path, pg_size, chunk_size, arena1.num_chunks(), dispose_handle_first);
std::cout << "[" << ::elapsed() << "] arena 2 loaded, going to release chunks 1 and 2 from arena 1" << std::endl;
arena1.release_chunk(1);
arena1.release_chunk(2);
}
}
}
请参考这个 gist,其中包含运行上述代码的输出和运行
TempFileMapping(false)
和 TempFileMapping(true)
时的 系统空闲内存 和磁盘活动的截图链接。