天天看点

64位x86的函数调用栈布局

作者:[email protected]博客:blog.focus-linux.net    linuxfocus.blog.chinaunix.net

为啥还要就64位的情况单开一篇文章呢,难道64位与32位不一样吗?

还是先看测试代码:

#include stdlib.h>

#include stdio.h>

static void test(void *p1, void *p2, int p3)

{

    p1 = p1;

    p2 = p2;

    p3 = p3;

}

int main()

    void *p1 = (void*)1;

    void *p2 = (void*)2;

    int p3 = 3;

    test(p1, p2, p3);

    return 0;

编译gcc -g -Wall test.c,调试进入test

(gdb) bt

#0 test (p1=0x1, p2=0x2, p3=3) at test.c:10

#1 0x0000000000400488 in main () at test.c:18

查看寄存器bp

(gdb) info registers rbp

rbp 0x7fffab620d00 0x7fffab620d00

那么检查栈的内容

(gdb) x /16xg 0x7fffab620d00

0x7fffab620d00: 0x00007fffab620d30 0x0000000000400488

0x7fffab620d10: 0x00000000004004a0 0x0000000000000002

0x7fffab620d20: 0x0000000000000001 0x0000000300000000

0x7fffab620d30: 0x0000000000000000 0x00007f93bbaa11c4

0x7fffab620d40: 0x0000000000400390 0x00007fffab620e18

0x7fffab620d50: 0x0000000100000000 0x0000000000400459

0x7fffab620d60: 0x00007f93bc002c00 0x85b4aff07d2e87c7

0x7fffab620d70: 0x0000000000000000 0x00007fffab620e10

开始分析栈的内容:

1. 0x00007fffab620d30:为test调用者main的BP内容,没有问题;

2. 0x0000000000400488:为test的返回地址,与前面的bt输出相符,没有问题;

3. 0x00000000004004a0:——这个是什么东东??!!

4. 0x0000000000000002, 0x0000000000000001, 0x0000000300000000:这里也有不少疑问啊?!

1. 这个0x00000003是第3个参数?因为是整数所以在64位的机器上,只使用栈的一个单元的一半空间?

2. 参数的顺序为什么是3,1,2呢?难道是因为前两个参数为指针,第三个参数为int有关?

我在工作中遇到了类似的问题,所以才特意写了上面的测试代码,就为了测试相同参数原型的函数调用栈的问题。看到这里,感觉很奇怪,对于上面两个问题很困惑啊。上网也没有找到64位的x86函数调用栈的特别的资料。

难道64位机与32位机有这么大的不同?!大家先想一下,答案马上揭晓。

当遇到疑难杂症时,汇编则是王道:

(gdb) disassemble main

Dump of assembler code for function main:

0x0000000000400459 : push %rbp

0x000000000040045a : mov %rsp,%rbp

0x000000000040045d : sub $0x20,%rsp

0x0000000000400461 : movq $0x1,-0x10(%rbp)

0x0000000000400469 : movq $0x2,-0x18(%rbp)

0x0000000000400471 : movl $0x3,-0x4(%rbp)

0x0000000000400478 : mov -0x4(%rbp),%edx

0x000000000040047b : mov -0x18(%rbp),%rsi

0x000000000040047f : mov -0x10(%rbp),%rdi

0x0000000000400483 : callq 0x400448

0x0000000000400488 : mov $0x0,%eax

0x000000000040048d : leaveq

0x000000000040048e : retq

End of assembler dump.

看红色部分的汇编代码,为调用test时的处理,原来64位机器上,调用test时,根本没有对参数进行压栈,所以上面对于栈内容的分析有误。后面的内存中存放的根本不是test的参数。看到汇编代码,我突然想起,由于64位cpu的寄存器比32位cpu的寄存器要多,所以gcc会尽量使用寄存器来传递参数来提高效率。

让我们重新运行程序,再次在test下查看寄存器内容:

(gdb) info registers

rax 0x7f141fea1a60 139724411509344

rbx 0x7f14200c2c00 139724413742080

rcx 0x4004a0 4195488

rdx 0x3 3

rsi 0x2 2

rdi 0x1 1

rbp 0x7fff9c08d380 0x7fff9c08d380

rsp 0x7fff9c08d380 0x7fff9c08d380

这里rdx,rsi和rdi清晰的显示了三个参数的值,分别为3,2,1与前面的反汇编代码相符。

而前面被当做参数的0x0000000000000002, 0x0000000000000001和0x00000003,其实为main中的局部变量p2, p1和p3的定义。如前面反汇编代码中的蓝色代码,这三个局部变量在栈上的定义顺序为p3, p1和p2,与栈的内容相符。

我写本文的目的,主要是为了与大家分享一下64位机器上调试时需要注意的一个问题:函数调用时,编译器会尽量使用寄存器来传递参数,这点与32位机有很大不同。在我们的调试中,要特别注意这点。

注:关于压栈顺序,参数的传递方式等等,都可以通过编译选项来指定或者禁止的。本文的情况为GCC的默认行为。

继续阅读