20得票2回答
有没有一种方法可以将kptr_restrict设置为0?

我目前在运行Linux perf时遇到了麻烦,主要是因为/proc/sys/kernel/kptr_restrict当前设置为1。 然而,如果我尝试像以下这样通过将0回显到其中来更改/proc/sys/kernel/kptr_restrict ...echo 0 > /proc/sys...

20得票1回答
Linux perf如何计算缓存引用和缓存未命中事件?

我对perf events中的cache-misses和 L1-icache-load-misses,L1-dcache-load-misses,LLC-load-misses感到困惑。当我尝试使用perf stat来统计它们时, 答案似乎不一致:%$: sudo perf stat -B -...

19得票3回答
perf.data文件中没有样本数据。

我在 Ubuntu 11.10 上使用 perf 3.0.4。它的 record 命令能够正常运行并显示收集的 256 个样本。但当我使用 perf report 命令时,会出现以下错误:perf.data file has no samples 我对这个问题进行了很多搜索,但尚未取得成功。

19得票2回答
如何使用Linux的`perf`工具生成“Off-CPU”性能分析报告

Brendan D. Gregg(《DTrace书》的作者)提出了一种有趣的分析技术:"Off-CPU" profiling(和Off-CPU Flame Graph;slides 2013, p112-137),以查看线程或应用程序在哪里被阻塞(未被CPU执行,但正在等待I/O,页面错误处理...

19得票2回答
分析不同内核版本导致性能回归的原因

我在x86_64系统上从Linux内核3.11到3.12发现了性能回归的问题。在Fedora 20上运行Mark Stock的Radiance基准测试,3.12明显变慢。除了内核版本不同外,其他都没有改变 - 二进制文件相同,glibc相同。耗时程序rpict是100% CPU绑定用户级代码。...

17得票2回答
在Linux上进行线程利用率分析

Linux性能工具非常适合找到CPU周期热点并优化这些热点。但一旦某些部分被并行化,就很难发现顺序执行的部分,因为它们占据了相当大的墙上时间,但不一定需要很多CPU周期(并行部分已经在消耗这些周期)。 为避免XY问题:我的基本动机是找到多线程代码中的顺序瓶颈。尽管由于阿姆达尔定律顺序执行的阶段...

17得票2回答
启用性能分析工具对调用图的符号解析

如何在perf callgraph中启用C++符号重整?当我进入annotate模式时,它似乎会对符号进行解析,但在主callgraph中没有。示例代码(使用Google Benchmark):#include <benchmark/benchmark.h> #include &l...

17得票2回答
理解 lfence 对具有两个长依赖链的循环的影响,针对逐渐增长的长度

我在玩 这个答案 中的代码,稍作修改: BITS 64 GLOBAL _start SECTION .text _start: mov ecx, 1000000 .loop: ;T is a symbol defined with the CLI (-DT=...) TIM...

17得票2回答
无法为C++方法添加perf探针

我试图为我的库中的C++方法添加perf probe,但我不断收到以下错误消息:$ perf probe --exec=/path/to/file --add='my::Own::Method' Semantic error :There is non-digit char in line n...

17得票1回答
LBR、DWARF和fp在perf record中的选项分别是什么意思?

当我在我的代码上使用perf record命令时,我发现有三个不同的选项供选择:lbr(最后分支记录)、dwarf和fp。它们之间有什么区别?