为什么会出现这个链接器警告和段错误?

4

我最近将一些外部库的版本从librdkafka 1.3.0升级到librdkafka 1.6.1。

在构建外部库后,它被链接为共享对象。

然后当我的程序被链接时,出现了以下警告。

/opt/rh/devtoolset-7/root/usr/libexec/gcc/x86_64-redhat-linux/7/ld:
Warning: type of symbol `mtx_lock' changed from 2 to 1 
in ../externals/synapfilter/lib/libsnf.a(memoryUtil.cpp.o)

程序执行过程中发生了段错误。 gdb的输出如下。

Program terminated with signal SIGSEGV, Segmentation fault.
b#0  0x0000000000f27a80 in mtx_lock ()
Missing separate debuginfos, use: debuginfo-install bzip2-libs-1.0.5-7.el6_0.x86_64 cyrus-sasl-lib-2.1.23-15.el6_6.2.x86_64 glibc-2.12-1.192.el6.x86_64 keyutils-libs-1.4-5.el6.x86_64 krb5-libs-1.10.3-57.el6.x86_64 libcom_err-1.41.12-22.el6.x86_64 libgcc-4.4.7-17.el6.x86_64 libicu-4.2.1-14.el6.x86_64 libselinux-2.0.94-7.el6.x86_64 libstdc++-4.4.7-17.el6.x86_64 libzstd-1.4.5-3.el6.x86_64 lz4-r131-1.el6.x86_64 nss-softokn-freebl-3.14.3-23.3.el6_8.x86_64 openssl-1.0.1e-57.el6.x86_64 zlib-1.2.3-29.el6.x86_64
(gdb) bt
#0  0x0000000000f27a80 in mtx_lock ()
#1  0x00007f59479a38cc in rd_kafka_global_cnt_incr () at rdkafka.c:182
#2  rd_kafka_new (type=type@entry=RD_KAFKA_PRODUCER, app_conf=app_conf@entry=0x2531870, errstr=errstr@entry=0x7ffd71c7c7d0 <incomplete sequence \350>,
    errstr_size=errstr_size@entry=512) at rdkafka.c:2092

我发现在使用的两个外部库中,名称(mtx_lock)重复了。
libsnf.a的一个目标文件中,它被用作全局变量。
$ objdump -t memoryUtil.cpp.o | grep mtx_lock
0000000000000000 g     O .bss   0000000000000028 mtx_lock

同时,这个名称也被用作 librdkafka.a 中的一个对象文件的函数名称。

$ objdump -t tinycthread.o | grep mtx_lock
0000000000000090 g     F .text  0000000000000016 mtx_lock

我想知道为什么会发生这种情况以及如何修复它。
在我的makefile中,我将一个静态库libsnf.a和一个动态库librdkafka.so链接在一起。

这被称为名称冲突。 - eerorika
一个负责任的名为libfoo的库只会导出以foo开头的符号名称,因此应该是snfmtx_lock。导出通用名称会引发问题。 - stark
1
向这两个库提交一个错误报告,希望其中一个或者两个都能修复它。 - Alan Birtles
除了报告错误之外,使用./configure命令创建共享库时还有其他修复方法吗? - user7024
1个回答

0
我想知道为什么会发生这种情况。
你有两个单独的目标文件:memoryUtil.cpp.otinycthread.o,它们定义了相同的符号:mtx_lock。其中一个将其定义为函数,另一个将其定义为变量。
通常,这应该在链接时导致“多次定义”符号错误,但你却收到了警告。我不确定为什么;也许其中一个符号定义是弱的。
(一般来说,你不应该使用objdump查看ELF符号--而应该使用readelf -Ws。)
你的程序继续调用mtx_lock(),但得到的是数据变量,然后崩溃了。
并且如何修复它。
由于这些库是开源的,最简单的解决方法是重命名一个(或两个)变量,并重新构建。
如果你不想重新构建,你可以使用objcopy --redefine-sym ...来实现相同的结果。
更新:

mtx_lock() 函数是 C11 标准 的一部分,这使得它在 libsnf 中作为变量的使用非常棘手。


1
mtx_lock() 是由 C11 定义的,因此强烈建议更改变量名称而不是函数名称(tinycthread 的 mtx_lock() 函数是 pthread 的包装器,适用于不支持 C11 线程的系统)。 - Edenhill

网页内容由stack overflow 提供, 点击上面的
可以查看英文原文,
原文链接