以编程方式获取缓存行大小?

199

10
C++17将提供一个编译时的近似值:https://dev59.com/l1kS5IYBdhLWcg3wj3jP。 - GManNickG
除了C/C++之外,如果您不介意使用汇编语言来获取此类信息,您可以查看SDL2的源代码中的SDL_GetCPUCacheLineSize函数(扩展自negamartin的答案),然后查看cpuid宏,该宏具有每个处理器型号的汇编源代码。 您可以查看https://imgur.com/a/KP57m6s或直接查看源代码。 - haxpor
获取缓存和缓存行大小的代码。 - philip
9个回答

216

在Linux上(使用相对较新的内核),您可以从/sys目录中获取此信息:

/sys/devices/system/cpu/cpu0/cache/

这个目录有每个缓存级别的子目录。这些目录中包含以下文件:

coherency_line_size
level
number_of_sets
physical_line_partition
shared_cpu_list
shared_cpu_map
size
type
ways_of_associativity

这提供了比你所期望知道的缓存更多的信息,包括缓存行大小(coherency_line_size)以及共享此缓存的CPU。如果您正在使用共享数据的多线程编程(如果共享数据的线程还共享缓存,则会获得更好的结果),那么这非常有用。


4
哪个文件包含缓存行大小?我假设是coherency_line_size?还是physical_line_partition? - oz10
8
确定一下:这是以字节为单位的,对吗? - Jakub M.
7
是的,coherency_line_size 的单位是字节。 - John Zwinck
6
@android: 我使用Fedora-18 x64机器,配备Core-i5处理器。在我的系统中,cat /sys/devices/system/cpu/cpu0/cache/index0/coherency_line_size 返回 64。对于索引1、2、3文件夹也是如此。 - Abid Rahman K
2
这种技术在“Windows Subsystem for Linux”上不起作用,但是sysconf(_SC_LEVEL1_DCACHE_LINESIZE)在WSL上可以使用。 - Myria
显示剩余2条评论

187

在Linux上查看sysconf(3)。

sysconf (_SC_LEVEL1_DCACHE_LINESIZE)

您也可以使用getconf命令从命令行获取它:

$ getconf LEVEL1_DCACHE_LINESIZE
64

7
简单的回答最好! - FrankH.
11
这是字节单位。 - Maarten Bamelis
1
终于了!希望更多的人看到这个答案以节省时间。 - Elinx

127

我一直在研究缓存行相关的内容,需要编写一个跨平台函数。我已经提交了代码到 GitHub 仓库:https://github.com/NickStrupat/CacheLineSize,或者你也可以使用下面提供的源码。欢迎自由使用。

#ifndef GET_CACHE_LINE_SIZE_H_INCLUDED
#define GET_CACHE_LINE_SIZE_H_INCLUDED

// Author: Nick Strupat
// Date: October 29, 2010
// Returns the cache line size (in bytes) of the processor, or 0 on failure

#include <stddef.h>
size_t cache_line_size();

#if defined(__APPLE__)

#include <sys/sysctl.h>
size_t cache_line_size() {
    size_t line_size = 0;
    size_t sizeof_line_size = sizeof(line_size);
    sysctlbyname("hw.cachelinesize", &line_size, &sizeof_line_size, 0, 0);
    return line_size;
}

#elif defined(_WIN32)

#include <stdlib.h>
#include <windows.h>
size_t cache_line_size() {
    size_t line_size = 0;
    DWORD buffer_size = 0;
    DWORD i = 0;
    SYSTEM_LOGICAL_PROCESSOR_INFORMATION * buffer = 0;

    GetLogicalProcessorInformation(0, &buffer_size);
    buffer = (SYSTEM_LOGICAL_PROCESSOR_INFORMATION *)malloc(buffer_size);
    GetLogicalProcessorInformation(&buffer[0], &buffer_size);

    for (i = 0; i != buffer_size / sizeof(SYSTEM_LOGICAL_PROCESSOR_INFORMATION); ++i) {
        if (buffer[i].Relationship == RelationCache && buffer[i].Cache.Level == 1) {
            line_size = buffer[i].Cache.LineSize;
            break;
        }
    }

    free(buffer);
    return line_size;
}

#elif defined(linux)

#include <stdio.h>
size_t cache_line_size() {
    FILE * p = 0;
    p = fopen("/sys/devices/system/cpu/cpu0/cache/index0/coherency_line_size", "r");
    unsigned int i = 0;
    if (p) {
        fscanf(p, "%d", &i);
        fclose(p);
    }
    return i;
}

#else
#error Unrecognized platform
#endif

#endif

18
在Linux中,使用sysconf(_SC_LEVEL1_DCACHE_LINESIZE)可能更好。 - hookenz
@Matt 为什么?只是好奇:-)。 - user35915

33
在x86上,您可以使用函数2的CPUID指令来确定缓存和TLB的各种属性。解析函数2的输出有些复杂,因此我会引用Intel Processor Identification and the CPUID Instruction(PDF)的3.1.3节。
要从C / C ++代码获取此数据,您需要使用内联汇编,编译器内置函数或调用外部汇编函数来执行CPUID指令。

有人知道如何在其他带有内置缓存的处理器上执行此操作吗? - oz10
3
@ceretullis:呃……x86处理器内置了缓存。你特别要寻找哪些“其他处理器”?你所问的是与平台相关的。 - Billy ONeal

11

如果您正在使用SDL2,您可以使用这个函数:

int SDL_GetCPUCacheLineSize(void);

返回 L1 缓存行大小(以字节为单位)。

在我的 x86_64 计算机上,运行此代码片段:

printf("CacheLineSize = %d",SDL_GetCPUCacheLineSize());

生成 CacheLineSize = 64

我知道我有点晚了,但是为了以后的访问者增加信息。 SDL文档目前说返回的数字是以KB为单位的,但实际上是以字节为单位的。


哦,这真的很有帮助。我要用SDL2编写一些游戏,所以这将非常有用。 - Nicholas Humphrey

9

8
在Windows平台上:
来自https://devblogs.microsoft.com/oldnewthing/20091208-01/?p=15733

GetLogicalProcessorInformation函数将提供系统中正在使用的逻辑处理器的特性。您可以遍历函数返回的SYSTEM_LOGICAL_PROCESSOR_INFORMATION,寻找类型为RelationCache的条目。每个这样的条目都包含一个ProcessorMask,告诉您该条目适用于哪个处理器(或多个处理器),以及在CACHE_DESCRIPTOR中,它告诉您正在描述什么类型的缓存以及该缓存的缓存行大小。


4
ARMv6及以上版本具有C0或缓存类型寄存器。但是,它仅在特权模式下可用。
例如,从Cortex™-A8技术参考手册中:

缓存类型寄存器的目的是确定指令和数据缓存的最小行长度(以字节为单位),以使一系列地址无效。

缓存类型寄存器是:

  • 只读寄存器
  • 仅在特权模式下可访问。

缓存类型寄存器的内容取决于具体实现。图3-2显示了缓存类型寄存器的位排列...


不要假定ARM处理器有缓存(显然,有些可以在没有缓存的情况下配置)。确定它的标准方法是通过C0。来自ARM ARM,B6-6页:

从ARMv6开始,系统控制协处理器缓存类型寄存器是定义L1缓存的强制方法,请参见B6-14页上的Cache Type寄存器。这也是早期架构的推荐方法。此外,考虑到B6-12页上的附加缓存级别,描述了第2级缓存支持的架构指南。


3

你也可以尝试通过测量一些时间来以编程方式完成。显然,它不总是像cpuid等那样精确,但更具可移植性。ATLAS在其配置阶段执行此操作,您可能需要查看它:

http://math-atlas.sourceforge.net/


网页内容由stack overflow 提供, 点击上面的
可以查看英文原文,
原文链接