天天看点

BSS段、数据段、代码段、堆与栈

bss段:bss段(bss segment)通常是指用来存放程序中未初始化的全局变量的一块内存区域。bss是英文block started by symbol的简称。bss段属于静态内存分配。

数据段:数据段(data segment)通常是指用来存放程序中已初始化的全局变量的一块内存区域。数据段属于静态内存分配。

代码段:代码段(code segment/text segment)通常是指用来存放程序执行代码的一块内存区域。这部分区域的大小在程序运行前就已经确定,并且内存区域通常属于只读, 某些架构也允许代码段为可写,即允许修改程序。在代码段中,也有可能包含一些只读的常数变量,例如字符串常量等。

堆(heap):堆是用于存放进程运行中被动态分配的内存段,它的大小并不固定,可动态扩张或缩减。当进程调用malloc等函数分配内存时,新分配的内存就被动态添加到堆上(堆被扩张);当利用free等函数释放内存时,被释放的内存从堆中被剔除(堆被缩减)

栈(stack):栈又称堆栈, 是用户存放程序临时创建的局部变量,也就是说我们函数括弧“{}”中定义的变量(但不包括static声明的变量,static意味着在数据段中存放变量)。除此以外,在函数被调用时,其参数也会被压入发起调用的进程栈中,并且待到调用结束后,函数的返回值也会被存放回栈中。由于栈的先进先出特点,所以栈特别方便用来保存/恢复调用现场。从这个意义上讲,我们可以把堆栈看成一个寄存、交换临时数据的内存区。

【例一】

用cl编译两个小程序如下:

程序1:

int ar[30000];

void main()

{

    ......

}

程序2:

int ar[300000] =  {1, 2, 3, 4, 5, 6 };

发现程序2编译之后所得的.exe文件比程序1的要大得多。当下甚为不解,于是手工编译了一下,并使用了/fas编译选项来查看了一下其各自的.asm,发现在程序1.asm中ar的定义如下:

_bss segment

     ?ar@@3paha dd 0493e0h dup (?)    ; ar

_bss ends

而在程序2.asm中,ar被定义为:

_data segment

     ?ar@@3paha dd 01h     ; ar

                dd 02h

                dd 03h

                org $+1199988

_data ends

区别很明显,一个位于.bss段,而另一个位于.data段,两者的区别在于:全局的未初始化变量存在于.bss段中,具体体现为一个占位符;全局的已初始化变量存于.data段中;而函数内的自动变量都在栈上分配空间。.bss是不占用.exe文件空间的,其内容由操作系统初始化(清零);而.data却需要占用,其内容由程序初始化,因此造成了上述情况。

【例二】

编译如下程序(test.cpp):

#include <stdio.h>

#define len 1002000

int inbss[len];

float fa;

int indata[len]={1,2,3,4,5,6,7,8,9};

double dbb = 100.0;

const int cst = 100;

int main(void)

    int run[100] = {1,2,3,4,5,6,7,8,9};

    for(int i=0; i<len; ++i)

        printf("%d ", inbss[i]);

    return 0;

命令:cl /fa  test.cpp 回车 (/fa:产生汇编代码)

产生的汇编代码(test.asm):

    title    test.cpp

    .386p

include listing.inc

if @version gt 510

.model flat

else

_text    segment para use32 public 'code'

_text    ends

_data    segment dword use32 public 'data'

_data    ends

const    segment dword use32 public 'const'

const    ends

_bss    segment dword use32 public 'bss'

_bss    ends

_tls    segment dword use32 public 'tls'

_tls    ends

flat    group _data, const, _bss

    assume    cs: flat, ds: flat, ss: flat

endif

public    ?inbss@@3paha                    ; inbss

public    ?fa@@3ma                    ; fa

public    ?indata@@3paha                    ; indata

public    ?dbb@@3na                    ; dbb

_bss    segment

?inbss@@3paha dd 0f4a10h dup (?)            ; inbss

?fa@@3ma dd    01h dup (?)                ; fa

_data    segment

?indata@@3paha dd 01h                    ; indata

    dd    02h

    dd    03h

    dd    04h

    dd    05h

    dd    06h

    dd    07h

    dd    08h

    dd    09h

    org $+4007964

?dbb@@3na dq    04059000000000000r        ; 100    ; dbb

public    _main

extrn    _printf:near

$sg537    db    '%d ', 00h

_text    segment

_run$ = -400

_i$ = -404

_main    proc near

; file test.cpp

; line 13

    push    ebp

    mov    ebp, esp

    sub    esp, 404                ; 00000194h

    push    edi

; line 14

    mov    dword ptr _run$[ebp], 1

    mov    dword ptr _run$[ebp+4], 2

    mov    dword ptr _run$[ebp+8], 3

    mov    dword ptr _run$[ebp+12], 4

    mov    dword ptr _run$[ebp+16], 5

    mov    dword ptr _run$[ebp+20], 6

    mov    dword ptr _run$[ebp+24], 7

    mov    dword ptr _run$[ebp+28], 8

    mov    dword ptr _run$[ebp+32], 9

    mov    ecx, 91                    ; 0000005bh

    xor    eax, eax

    lea    edi, dword ptr _run$[ebp+36]

    rep stosd

; line 15

    mov    dword ptr _i$[ebp], 0

    jmp    short $l534

$l535:

    mov    eax, dword ptr _i$[ebp]

    add    eax, 1

    mov    dword ptr _i$[ebp], eax

$l534:

    cmp    dword ptr _i$[ebp], 1002000        ; 000f4a10h

    jge    short $l536

; line 16

    mov    ecx, dword ptr _i$[ebp]

    mov    edx, dword ptr ?inbss@@3paha[ecx*4]

    push    edx

    push    offset flat:$sg537

    call    _printf

    add    esp, 8

    jmp    short $l535

$l536:

; line 17

; line 18

    pop    edi

    mov    esp, ebp

    pop    ebp

    ret    0

_main    endp

end

 ----------------------------------------

通过汇编文件可以看到,数组inbss和indata位于不同的段(inbss位于bss段,而indata位于data段)

若把test.cpp中的indata数组拿掉,查看生成的exe文件的大小,可以发现,indata拿掉之后exe文件的大小小了很多。而若拿掉的是inbss数组,exe文件大小跟没拿掉时相差无几。

说明了:

bss段(未手动初始化的数据)并不给该段的数据分配空间,只是记录数据所需空间的大小。

data(已手动初始化的数据)段则为数据分配空间,数据保存在目标文件中。

数据段包含经过初始化的全局变量以及它们的值。bss段的大小从可执行文件中得到 ,然后链接器得到这个大小的内存块,紧跟在数据段后面。当这个内存区进入程序的地址空间后全部清零。包含数据段和bss段的整个区段此时通常称为数据区。