如何使用C++在运行时获取内存使用情况?

98

我需要在程序运行时获取我的程序的内存使用情况 VIRT 和 RES,并将它们显示出来。

到目前为止,我尝试过:

getrusage (http://linux.die.net/man/2/getrusage)

int who = RUSAGE_SELF; 
struct rusage usage; 
int ret; 

ret=getrusage(who,&usage);

cout<<usage.ru_maxrss;

但我总是得到0。


3
这取决于系统——似乎您的系统不支持通过getrusage报告maxrss,您能告诉我们您使用的发行版是什么吗? - tvanfosson
1
https://dev59.com/qnVD5IYBdhLWcg3wKoWH - DragonLord
11个回答

84
在Linux上,我从未找到过一个ioctl()的解决方案。对于我们的应用程序,我们编写了一个通用的实用程序例程,基于读取/proc/pid中的文件。有许多这些文件会给出不同的结果。这是我们选定的文件(问题被标记为C++,我们使用C++构造处理I/O,但如果需要,它应该很容易适应C I/O例程):
#include <unistd.h>
#include <ios>
#include <iostream>
#include <fstream>
#include <string>

//////////////////////////////////////////////////////////////////////////////
//
// process_mem_usage(double &, double &) - takes two doubles by reference,
// attempts to read the system-dependent data for a process' virtual memory
// size and resident set size, and return the results in KB.
//
// On failure, returns 0.0, 0.0

void process_mem_usage(double& vm_usage, double& resident_set)
{
   using std::ios_base;
   using std::ifstream;
   using std::string;

   vm_usage     = 0.0;
   resident_set = 0.0;

   // 'file' stat seems to give the most reliable results
   //
   ifstream stat_stream("/proc/self/stat",ios_base::in);

   // dummy vars for leading entries in stat that we don't care about
   //
   string pid, comm, state, ppid, pgrp, session, tty_nr;
   string tpgid, flags, minflt, cminflt, majflt, cmajflt;
   string utime, stime, cutime, cstime, priority, nice;
   string O, itrealvalue, starttime;

   // the two fields we want
   //
   unsigned long vsize;
   long rss;

   stat_stream >> pid >> comm >> state >> ppid >> pgrp >> session >> tty_nr
               >> tpgid >> flags >> minflt >> cminflt >> majflt >> cmajflt
               >> utime >> stime >> cutime >> cstime >> priority >> nice
               >> O >> itrealvalue >> starttime >> vsize >> rss; // don't care about the rest

   stat_stream.close();

   long page_size_kb = sysconf(_SC_PAGE_SIZE) / 1024; // in case x86-64 is configured to use 2MB pages
   vm_usage     = vsize / 1024.0;
   resident_set = rss * page_size_kb;
}

int main()
{
   using std::cout;
   using std::endl;

   double vm, rss;
   process_mem_usage(vm, rss);
   cout << "VM: " << vm << "; RSS: " << rss << endl;
}

1
你是否对不同的*nix平台下/proc/self/stat结构有任何保证?我不确定,但如果有的话,那就好了。 - bayda
1
多年来,我主要使用Solaris、HP-UX和Linux。/proc/self/stat似乎是Linux特有的。上面的程序原始版本中有#if块用于Solaris,因为它有所不同。 - Don Wakefield
我假设OP只关心基于Linux的问题标签。读取/proc将是您能够获得的最好信息。在Solaris上,您还可以通过kstat获取各种信息(尽管它通常会复制您可以通过其他方式获得的信息)。 - stsquad
我晚了10年才来参加这个派对,但你介意告诉我为什么要将vsize除以1024.0而不是1024吗? - a_river_in_canada
“River(河流)”,抱歉,但正如您所提到的,许多年过去了。如果我有任何原因,那已经被时间所遗忘(我没能通过在注释中记录这个特殊的选择而让大家失望)。我的唯一辩解是,在这种情况下,1024.0可以表示1024而不会失去精度…… - Don Wakefield
2
关于“为什么是1024.0?”的问题 - 这会告诉编译器首先将其转换为double,然后进行除法运算以获得double结果。另一个选择:“vm_usage = vsize / 1024;”会首先执行除法运算(正如@DonWakefield所暗示的那样),然后再转换为double(这样会丢失精度)。 - Jesse Chisholm

62

David Robert Nadeau在他的网站上提供了一个良好的自包含多平台C函数,用于获取进程驻留集大小(物理内存使用)

/*
 * Author:  David Robert Nadeau
 * Site:    http://NadeauSoftware.com/
 * License: Creative Commons Attribution 3.0 Unported License
 *          http://creativecommons.org/licenses/by/3.0/deed.en_US
 */

#if defined(_WIN32)
#include <windows.h>
#include <psapi.h>

#elif defined(__unix__) || defined(__unix) || defined(unix) || (defined(__APPLE__) && defined(__MACH__))
#include <unistd.h>
#include <sys/resource.h>

#if defined(__APPLE__) && defined(__MACH__)
#include <mach/mach.h>

#elif (defined(_AIX) || defined(__TOS__AIX__)) || (defined(__sun__) || defined(__sun) || defined(sun) && (defined(__SVR4) || defined(__svr4__)))
#include <fcntl.h>
#include <procfs.h>

#elif defined(__linux__) || defined(__linux) || defined(linux) || defined(__gnu_linux__)
#include <stdio.h>

#endif

#else
#error "Cannot define getPeakRSS( ) or getCurrentRSS( ) for an unknown OS."
#endif





/**
 * Returns the peak (maximum so far) resident set size (physical
 * memory use) measured in bytes, or zero if the value cannot be
 * determined on this OS.
 */
size_t getPeakRSS( )
{
#if defined(_WIN32)
    /* Windows -------------------------------------------------- */
    PROCESS_MEMORY_COUNTERS info;
    GetProcessMemoryInfo( GetCurrentProcess( ), &info, sizeof(info) );
    return (size_t)info.PeakWorkingSetSize;

#elif (defined(_AIX) || defined(__TOS__AIX__)) || (defined(__sun__) || defined(__sun) || defined(sun) && (defined(__SVR4) || defined(__svr4__)))
    /* AIX and Solaris ------------------------------------------ */
    struct psinfo psinfo;
    int fd = -1;
    if ( (fd = open( "/proc/self/psinfo", O_RDONLY )) == -1 )
        return (size_t)0L;      /* Can't open? */
    if ( read( fd, &psinfo, sizeof(psinfo) ) != sizeof(psinfo) )
    {
        close( fd );
        return (size_t)0L;      /* Can't read? */
    }
    close( fd );
    return (size_t)(psinfo.pr_rssize * 1024L);

#elif defined(__unix__) || defined(__unix) || defined(unix) || (defined(__APPLE__) && defined(__MACH__))
    /* BSD, Linux, and OSX -------------------------------------- */
    struct rusage rusage;
    getrusage( RUSAGE_SELF, &rusage );
#if defined(__APPLE__) && defined(__MACH__)
    return (size_t)rusage.ru_maxrss;
#else
    return (size_t)(rusage.ru_maxrss * 1024L);
#endif

#else
    /* Unknown OS ----------------------------------------------- */
    return (size_t)0L;          /* Unsupported. */
#endif
}





/**
 * Returns the current resident set size (physical memory use) measured
 * in bytes, or zero if the value cannot be determined on this OS.
 */
size_t getCurrentRSS( )
{
#if defined(_WIN32)
    /* Windows -------------------------------------------------- */
    PROCESS_MEMORY_COUNTERS info;
    GetProcessMemoryInfo( GetCurrentProcess( ), &info, sizeof(info) );
    return (size_t)info.WorkingSetSize;

#elif defined(__APPLE__) && defined(__MACH__)
    /* OSX ------------------------------------------------------ */
    struct mach_task_basic_info info;
    mach_msg_type_number_t infoCount = MACH_TASK_BASIC_INFO_COUNT;
    if ( task_info( mach_task_self( ), MACH_TASK_BASIC_INFO,
        (task_info_t)&info, &infoCount ) != KERN_SUCCESS )
        return (size_t)0L;      /* Can't access? */
    return (size_t)info.resident_size;

#elif defined(__linux__) || defined(__linux) || defined(linux) || defined(__gnu_linux__)
    /* Linux ---------------------------------------------------- */
    long rss = 0L;
    FILE* fp = NULL;
    if ( (fp = fopen( "/proc/self/statm", "r" )) == NULL )
        return (size_t)0L;      /* Can't open? */
    if ( fscanf( fp, "%*s%ld", &rss ) != 1 )
    {
        fclose( fp );
        return (size_t)0L;      /* Can't read? */
    }
    fclose( fp );
    return (size_t)rss * (size_t)sysconf( _SC_PAGESIZE);

#else
    /* AIX, BSD, Solaris, and Unknown OS ------------------------ */
    return (size_t)0L;          /* Unsupported. */
#endif
}

使用方法

size_t currentSize = getCurrentRSS( );
size_t peakSize    = getPeakRSS( );

欲了解更多,请查看网站,它还提供一个获取系统物理内存大小的函数


2
最好将 #pragma comment(lib, "psapi.lib") 添加到 #if defined(_WIN32) 范围内。 - Bloodmoon
2
@Bloodmon 如果有人使用的是 Windows 但不是 Microsoft 编译器呢?那个编译指示会导致编译器失败。 - Adrian
这段代码使用了getrusage中的rusage::ru_maxrss,但OP报告说它对她不起作用。 - facetus

22

旧版:

maxrss 表示进程可用的最大内存量。0表示该进程没有限制。你可能想要查看的是未共享数据使用量 ru_idrss

新版: 似乎上述方法实际上并不起作用,因为内核并未填充大多数值。更好的方法是从 proc 中获取信息。但与其自己解析,使用 libproc(procps 的一部分)会更容易,具体如下:

// getrusage.c
#include <stdio.h>
#include <proc/readproc.h>

int main() {
  struct proc_t usage;
  look_up_our_self(&usage);
  printf("usage: %lu\n", usage.vsize);
}

使用"gcc -o getrusage getrusage.c -lproc"进行编译。


1
除非在Linux中都不可用。 - jmanning2k
2
这是不正确的。maxrss 是进程的峰值内存使用量,而不是最大可用量 —— 这应该使用 getrlimit(RLIMIT_DATA, &rl)。 - jmanning2k
2
#include <proc/readproc.h> 的解决方案在 Ubuntu 下对我非常有效。我必须安装 libproc-dev 包。usage.vm_data 是我所需的足够接近的近似值。您可以在此处查看有关内存统计信息的文档:/usr/include/proc/readproc.h。我尝试过的所有选项似乎都是以字节为单位,而不是页面。我不认为我的进程使用了 4600 万个页面。认为此解决方案在 Linux 下无法工作的评论似乎是误导的。 - Allan Stokes
3
正确的链接器是:-lprocps。 - Sembiance
1
非常棒,这个应该被接受为答案! - Pekov

12
唐·韦克菲尔德方法的更优雅方式:
#include <unistd.h>
#include <iostream>
#include <fstream>

using namespace std;

int main(){

    int tSize = 0, resident = 0, share = 0;
    ifstream buffer("/proc/self/statm");
    buffer >> tSize >> resident >> share;
    buffer.close();

    long page_size_kb = sysconf(_SC_PAGE_SIZE) / 1024; // in case x86-64 is configured to use 2MB pages
    double rss = resident * page_size_kb;
    cout << "RSS - " << rss << " kB\n";

    double shared_mem = share * page_size_kb;
    cout << "Shared Memory - " << shared_mem << " kB\n";

    cout << "Private Memory - " << rss - shared_mem << "kB\n";
    return 0;
}

1
如果你遇到了错误,可以添加 #include <unistd.h>。 - Bensuperpc

9

7
现有的答案更好,可以告诉你如何获得正确的值,但我至少可以解释为什么getrusage对你不起作用。
man 2 getrusage:
上面的结构体[rusage]来自于BSD 4.3 Reno。在Linux下,并非所有字段都有意义。目前(Linux 2.4、2.6),只维护ru_utime、ru_stime、ru_minflt、ru_majflt和ru_nswap这些字段。

3

基于Don W的解决方案,使用更少的变量。

void process_mem_usage(double& vm_usage, double& resident_set)
{
    vm_usage     = 0.0;
    resident_set = 0.0;

    // the two fields we want
    unsigned long vsize;
    long rss;
    {
        std::string ignore;
        std::ifstream ifs("/proc/self/stat", std::ios_base::in);
        ifs >> ignore >> ignore >> ignore >> ignore >> ignore >> ignore >> ignore >> ignore >> ignore >> ignore
                >> ignore >> ignore >> ignore >> ignore >> ignore >> ignore >> ignore >> ignore >> ignore >> ignore
                >> ignore >> ignore >> vsize >> rss;
    }

    long page_size_kb = sysconf(_SC_PAGE_SIZE) / 1024; // in case x86-64 is configured to use 2MB pages
    vm_usage = vsize / 1024.0;
    resident_set = rss * page_size_kb;
}

3

除了您的方式之外,您还可以调用系统ps命令并从其输出中获取内存使用情况。或者从/proc/pid(请参阅PIOCPSINFO结构)中读取信息。

注:PIOCPSINFO是一个结构体类型,这里不做解释。

我使用过的任何Linux系统中都没有真正提供PIOCPSINFO。从/proc/pid读取是非常常见的。我会在答案中发布Linux的示例代码... - Don Wakefield
是的,/proc/pid结构在不同的*nix平台上可能会有所不同,但如果您有PIOCPSINFO,这就无关紧要了。 我曾经遇到过这种情况,在某些Solaris版本上没有定义这个结构。在这种情况下,我使用了ps输出。 - bayda

2
在您的系统中有一个名为/proc/self/statm的文件。 proc文件系统是一个伪文件系统,提供了一个接口到内核数据结构。该文件包含您需要的信息,以只包含整数的列以空格分隔。
列号:
  1. = 总程序大小(/ proc / [pid] / status中的VmSize)

  2. = 常驻集大小(/ proc / [pid] / status中的VmRSS)

有关更多信息,请参见LINK

1

我正在使用另一种方法来实现这个目标,听起来很现实。我通过getpid()函数获取进程的PID,然后使用/proc/pid/stat文件。我相信stat文件的第23列是vmsize(请参考Don的帖子)。您可以在代码中需要的任何地方从文件中读取vmsize。如果您想知道代码片段可能使用多少内存,您可以在该片段之前读取该文件一次,在之后再读取一次,并将它们相减。


网页内容由stack overflow 提供, 点击上面的
可以查看英文原文,
原文链接