Linux下对mmap映射的大文件进行窗口控制。

Question

Linux下对mmap映射的大文件进行窗口控制。

4

当我们映射一个大文件时，如何控制RSS中的窗口？现在让我解释一下我的意思。

例如，我们有一个超过RAM几倍的大文件，我们为几个进程进行共享内存映射，如果我们访问一些虚拟地址位于此映射内存中的对象并捕获页面错误，那么从磁盘读取，子问题是，如果我们不再使用给定的对象，是否会发生相反的情况？如果这种情况像LRU一样发生，那么LRU的大小是多少，如何控制它？在这种情况下，页面缓存如何参与？

RSS图表

这是测试实例（2个线程，8 GB RAM）上80 GB tar文件的RSS图表。这个3800 MB的值从哪里来，并且在我映射文件后运行时保持稳定？我如何控制它（或建议内核控制它）？

- Vladislav Markov

1个回答

网页内容由stack overflow 提供, 点击上面的

可以查看英文原文，
原文链接

- Dan Bonachea · Accepted Answer

只要您没有采取明确的行动来锁定内存中的页面，它们应该最终会自动交换出去。内核基本上使用内存压力启发式来决定将多少物理内存用于换入的页面，并根据需要频繁地重新平衡。

如果您想在控制此过程方面发挥更积极的作用，请查看{{link1：madvise()系统调用}}。

这使您可以为您的mmap调整分页算法，采取以下操作：

MADV_FREE（自Linux 4.5起）
- 应用程序不再需要addr和len指定的范围内的页面。内核因此可以释放这些页面，但释放可能会延迟到发生内存压力时。
MADV_COLD（自Linux 5.4起）
- 停用给定范围的页面。这将使页面成为更可能的回收目标，如果存在内存压力，则会回收。
MADV_SEQUENTIAL
- 期望按顺序引用页面。（因此，给定范围内的页面可以被积极地预读，并且在访问后不久可能会被释放。）
MADV_WILLNEED
- 期望在不久的将来进行访问。（因此，最好提前读取一些页面。）
MADV_DONTNEED
- 不期望在不久的将来进行访问。（暂时，应用程序已经完成了给定范围的操作，因此内核可以释放与之相关的资源。）

在创建了 mmap 之后发出 madvise(MADV_SEQUENTIAL) 可能足以获得可接受的行为。如果不行，您还可以在遍历时穿插一些 MADV_WILLNEED/MADV_DONTNEED 访问提示（和/或 MADV_FREE/MADV_COLD），以便在通过页面组时进行操作。