Linux内核中的percpu指针是如何实现的？

Question

Linux内核中的percpu指针是如何实现的？

linuxlinux-kernelsmp

19

在多处理器上，每个核心都可以拥有自己的变量。我认为它们是不同的变量，位于不同的地址，尽管它们在同一进程中并且具有相同的名称。

但我想知道，内核是如何实现这一点的？它是否分配了一块内存来存储所有percpu指针，并且每次通过移位或其他方式将指针重定向到特定地址？

- dspjm

1个回答

网页内容由stack overflow 提供, 点击上面的

可以查看英文原文，
原文链接

- ugoren · Accepted Answer

普通的全局变量不是针对每个CPU的。自动变量存储在堆栈上，并且不同的CPU使用不同的堆栈，因此它们自然而然地获得了分离的变量。

我猜你指的是Linux的per-CPU变量基础设施。
大部分的魔法都在这里（asm-generic/percpu.h）：

extern unsigned long __per_cpu_offset[NR_CPUS];

#define per_cpu_offset(x) (__per_cpu_offset[x])

/* Separate out the type, so (int[3], foo) works. */
#define DEFINE_PER_CPU(type, name) \
    __attribute__((__section__(".data.percpu"))) __typeof__(type) per_cpu__##name

/* var is in discarded region: offset to particular copy we want */
#define per_cpu(var, cpu) (*RELOC_HIDE(&per_cpu__##var, __per_cpu_offset[cpu]))
#define __get_cpu_var(var) per_cpu(var, smp_processor_id())

宏 RELOC_HIDE(ptr, offset) 简单地将指针 ptr 按给定的字节数（而不考虑指针类型）向前移动。

它是做什么用的？

当定义DEFINE_PER_CPU(int, x)时，一个整数__per_cpu_x将会在特殊的.data.percpu区域中被创建。
内核加载时，该区域会被多次加载 - 每个CPU加载一次 (这部分魔法不在上述代码中)。
__per_cpu_offset数组被填充了每个副本之间的距离。假设使用了1000字节的per cpu数据，__per_cpu_offset[n]将包含1000*n。
符号per_cpu__x将在加载期间被重定位到CPU 0的per_cpu__x。
__get_cpu_var(x)在CPU 3上运行时，将被转换为*RELOC_HIDE(&per_cpu__x, __per_cpu_offset[3])。这从CPU 0的x开始，加上CPU 0数据和CPU 3之间的偏移量，最终解引用结果指针。