一个奇怪的链接问题

前言

链接是代码生成可执行文件中一个非常重要的过程。我们在使用一些库函数时,有时候需要链接库,有时候又不需要,这是为什么呢?了解一些链接的基本过程,能够帮助我们在编译时解决一些奇怪的问题。比如,下面就有一种奇怪的现象。

一个奇怪的链接问题

程序功能很简单,计算e的n次方。程序清单如下(代码一):

1
2
3
4
5
6
7
8
#include<stdio.h>
#include<math.h>
int main(int argc,char *argv[])
{
double a = exp(2);
printf("%lf\n",a);
return 0;
}

编译运行:

1
2
3
gcc -o expTest expTest.c
./expTest
7.389056

一切似乎顺理成章,我们再来看下面这种情况(代码二):

1
2
3
4
5
6
7
8
9
#include<stdio.h>
#include<math.h>
int main(int argc,char *argv[])
{
int b = 2;
double a = exp(b);
printf("%lf\n",a);
return 0;
}

编译:

1
2
3
4
gcc -o expTest expTest.c
/tmp/ccx5lXbS.o:在函数‘main’中:
expTest.c:(.text+0x20):对‘exp’未定义的引用
collect2: error: ld returned 1 exit status

我们发现,同样的编译方法编译不过了,提示对‘exp’未定义的引用,并且抛出链接出错。

我们通过man命令查看exp函数:

1
2
3
4
5
6
7
8
9
10
11
12
man 3 exp
NAME
exp, expf, expl - base-e exponential function

SYNOPSIS
#include <math.h>

double exp(double x);
float expf(float x);
long double expl(long double x);

Link with -lm.

发现它除了需要包含头文件math.h外,编译时还需要使用-lm链接。
再次编译运行:

1
2
3
4
gcc -lm -o  expTest expTest.c 
/tmp/ccYT3E65.o:在函数‘main’中:
expTest.c:(.text+0x20):对‘exp’未定义的引用
collect2: error: ld returned 1 exit status

为什么还是不行呢?我们已经按照帮助手册的只是加了-lm了啊?难道是位置不对?我们换个位置试试:

1
2
3
gcc -o  expTest expTest.c -lm 
./expTest
7.389056

现在终于成功编译并运行。

分析

虽然最后终于成功编译运行,但是不免产生了几个疑问:

  • 两段代码同样都调用了exp函数,为什么一个需要链接,一个不需要链接呢?
  • 到底什么时候需要链接呢?
  • 为什么链接的时候放在前面就不行呢?

我们一一解答。
1.为什么一个需要链接,一个不需要?
我们可以观察到,代码一调用exp传入的参数是常量2,代码二调用exp传入的参数是变量b,那么对于代码一会不会在运行之前就计算好了呢?
我们来看一下它们的汇编代码。
代码一:

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
.LC1:
.string "%lf\n"
main:
push rbp
mov rbp, rsp
sub rsp, 32
mov DWORD PTR [rbp-20], edi
mov QWORD PTR [rbp-32], rsi
movsd xmm0, QWORD PTR .LC0[rip]
movsd QWORD PTR [rbp-8], xmm0
movsd xmm0, QWORD PTR [rbp-8]
mov edi, OFFSET FLAT:.LC1
mov eax, 1
call printf
mov eax, 0
leave
ret
.LC0:
.long 3100958126
.long 1075678820

代码二:

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
.LC0:
.string "%lf\n"
main:
push rbp
mov rbp, rsp
sub rsp, 32
mov DWORD PTR [rbp-20], edi
mov QWORD PTR [rbp-32], rsi
mov DWORD PTR [rbp-4], 2
cvtsi2sd xmm0, DWORD PTR [rbp-4]
call exp
movq rax, xmm0
mov QWORD PTR [rbp-16], rax
movsd xmm0, QWORD PTR [rbp-16]
mov edi, OFFSET FLAT:.LC0
mov eax, 1
call printf
mov eax, 0
leave
ret

汇编的具体细节我们无需尽知,但是我们可以很明显地看到,第二段代码调用了exp函数(call exp指令),而第一段代码没有看到调用exp的身影。
实际上,通过汇编代码可以看到,当传入参数为常量时,就已经计算好了值(emm0寄存器为浮点运算相关寄存器),最后根本不需要调用exp函数。而对于变量型的参数,其值在运行时确定,因此需要调用。我们还可以通过ldd命令来看它们链接的库有什么不同。
对于代码一:

1
2
3
4
ldd expTest
linux-vdso.so.1 => (0x00007ffec079d000)
libc.so.6 => /lib/x86_64-linux-gnu/libc.so.6 (0x00007fd327744000)
/lib64/ld-linux-x86-64.so.2 (0x00007fd327b0e000)

对于代码二:

1
2
3
4
5
ldd expTest
linux-vdso.so.1 => (0x00007ffefdfc9000)
libm.so.6 => /lib/x86_64-linux-gnu/libm.so.6 (0x00007f9afcccb000)
libc.so.6 => /lib/x86_64-linux-gnu/libc.so.6 (0x00007f9afc901000)
/lib64/ld-linux-x86-64.so.2 (0x00007f9afcfd4000)

可以看到,第二段代码编译出来的可执行文件,多依赖了libm.so.6,也就是exp函数所在的库。

2.什么时候需要链接?
事实上,C编译器总是主动传送libc.a或libc.so给链接器,也就是说,对于使用包含在libc.a或libc.so库中的函数,是不需要在编译时手动链接的。而调用函数是否需要链接,可以使用命令“man 3 函数名“查看,如果需要链接库,最后都有说明。

3.为什么链接的时候放在前面就不行呢?
这个就涉及到链接器的工作原理了,在此只简单说明一下:链接过程中,需要进行符号解析,并且是按照顺序解析;如果库链接在前,就可能出现库中的符号不会被需要,链接器不会把它加到未解析的符号集合中,那么后面引用这个符号的目标文件就不能解析该引用,导致最后链接失败。因此链接库的一般准则是将它们放在命令行的结尾

总结

通过前面的实例和分析,我们总结出以下几点:

  • 调用包含于libc库中的函数不需要链接。
  • 对于传参为常量的数学函数调用,生成可执行文件过程中可能将其优化,而无需调用该函数。
  • 库链接一般放在命令行结尾。
  • 通过man命令查看在调用某个函数时是否需要链接。
守望 wechat
关注公众号[编程珠玑]获取更多原创技术文章
出入相友,守望相助!