如何在Linux内核中使用lockdep特性进行死锁检测

Question

如何在Linux内核中使用lockdep特性进行死锁检测

19

我有一个与之交互的Linux内核驱动程序和用户应用程序。该内核驱动程序中存在死锁问题。我在Linux内核中找到了一个名为“lockdep”的特性，并成功进行了配置和重新编译内核（并且我确实在/ proc中看到了lockdep文件夹）。但我不知道如何推断此工具的输出，也不知道如何使用此工具来调试驱动程序。任何帮助将不胜感激。谢谢!

- brokenfoot

2个回答

1

这并不复杂 - 当锁定序列潜在死锁时，lockdep代码将简单地打印情况描述和堆栈回溯到内核日志中。您只需要观察内核输出（通过dmesg或串行线路或您使用的任何其他方式）。

lockdep代码仅调试锁定，无法警告您由其他原因引起的死锁。

- Andreas Bombe

如果在dmesg中没有看到任何与锁相关的死锁信息，我能否得出结论我的代码中没有死锁？Lockdep是否能够检测到每一个死锁？ - brokenfoot

@brokenfoot 不完全是这样。您必须练习所有导致锁定/解锁/睡眠/任何操作的代码路径。lockdep所做的是记录诸如“在锁定B之前已经获取了锁定A”的信息，并且如果它遇到两种情况，其中两个锁以相反的顺序被获取，则会发出警告。（这里的“锁”指“锁类”，因此即使对于两个不同的对象，结构中的锁也算作一个锁。） - Vegard

网页内容由stack overflow 提供, 点击上面的

可以查看英文原文，
原文链接

- brokenfoot · Accepted Answer

要启用lockdep功能，请通过menuconfig编辑.config文件：

make menuconfig

并在“Hacking选项”中启用以下内容：

 1. [*] Detect Hard and Soft Lockups
 2. [*] Detect Hung Tasks
 3. [*] RT Mutex debugging, deadlock detection
 4. -*- Spinlock and rw-lock debugging: basic checks
 5. -*- Mutex debugging: basic checks
 6. -*- Lock debugging: detect incorrect freeing of live locks
 7. [*] Lock debugging: prove locking correctness
 8. [*] Lock usage statistics

重新编译内核：

make ARCH=i386 -j4 //whatever your arch is

现在，启动新内核映像，在/proc下，您应该看到以下新文件夹：

/proc/lockdep
/proc/lockdep_chains
/proc/lockdep_stat
/proc/locks
/proc/lock_stats

现在，插入您认为导致错误的模块，并通过您的用户应用程序（或运行驱动程序模块的其他方式）访问它。如果应用程序死锁（挂起），请执行以下操作：

ps -aux | grep <app_name>

您应该在应用程序上看到一个+D（不可中断的休眠）状态，请执行以下操作：

dmesg

它打印的日志将包括导致死锁的函数/文件。

就是这样！