背景

最近準備

，案例的過程中準備了如下代碼碎片，示範解析

http scheme

#include <stdio.h>
#include <stdlib.h>
#include <string.h>

char *parse_scheme(const char *url)
{
    char *p = strstr(url,"://");
    return strndup(url,p-url);
}

int main()
{
    const char *url = "http://static.mengkang.net/upload/image/2019/0907/1567834464450406.png";
    char *scheme = parse_scheme(url);
    printf("%s\n",scheme);
    free(scheme);
    return 0;
}

上面是通過

strndup

的方式，背後也依托了

malloc

，是以最後也需要

free

。

有人在微信群私信

parse_scheme

能用

char []

來做傳回值嗎？我們知道棧上的數組也能用來存儲字元串，那我們可以改寫成下面這樣嗎？

char *parse_scheme(const char *url)
{
    char *p = strstr(url,"://");
    long l = p - url + 1;
    char scheme[l];
    strncpy(scheme, url, l-1);
    return scheme;
}

大多數人都知道不能這樣寫，因為傳回的是棧上的位址，當從該函數傳回之後，那段棧空間的操作權也釋放了，當再次使用該位址的時候，值就是不确定的了。

那我們今天就一起探讨下出現這樣情況的背後的真正原理。

基礎預備

每個函數運作的時候因為需要記憶體來存放函數參數以及局部變量等，需要給每個函數配置設定一段連續的記憶體，這段記憶體就叫做函數的棧幀（Stack Frame）。

因為是一塊連續的記憶體位址，是以叫幀；為什麼叫要加一個

棧

呢？

想必大家都熟悉了函數調用棧，為什麼叫函數調用棧呢？比如下面的表達式

array_values(explode(",",file_get_contents(...)));

函數的執行順序是最内層的函數最先執行，然後依次傳回執行外層的函數。是以函數的執行就是利用了棧的資料結構，是以就叫棧幀。

x86_64 cpu上的

rbp

寄存器存函數棧底位址，

rsp

寄存器存函數棧頂位址。

實驗

#include <stdio.h>

void foo(void)
{
    int i;
    printf("%d\n", i);
    i = 666;
}

int main(void)
{
    foo();
    foo();
    return 0;
}

$gcc -g 2.c

$./a.out
0
666

為什麼第二次調用

foo

函數輸出的結果都是上次函數調用的指派呢？先看下反彙編之後的代碼

000000000040052d <foo>:
#include <stdio.h>

void foo(void)
{
  40052d:    55                       push   %rbp
  40052e:    48 89 e5                 mov    %rsp,%rbp
  400531:    48 83 ec 10              sub    $0x10,%rsp
    int i;
    printf("%d\n", i);
  400535:    8b 45 fc                 mov    -0x4(%rbp),%eax
  400538:    89 c6                    mov    %eax,%esi
  40053a:    bf 00 06 40 00           mov    $0x400600,%edi
  40053f:    b8 00 00 00 00           mov    $0x0,%eax
  400544:    e8 c7 fe ff ff           callq  400410 <printf@plt>
    i = 666;
  400549:    c7 45 fc 9a 02 00 00     movl   $0x29a,-0x4(%rbp)
}
  400550:    c9                       leaveq
  400551:    c3                       retq

0000000000400552 <main>:

int main(void)
{
  400552:    55                       push   %rbp
  400553:    48 89 e5                 mov    %rsp,%rbp
    foo();
  400556:    e8 d2 ff ff ff           callq  40052d <foo>
    foo();
  40055b:    e8 cd ff ff ff           callq  40052d <foo>
    return 0;
  400560:    b8 00 00 00 00           mov    $0x0,%eax
}
  400565:    5d                       pop    %rbp
  400566:    c3                       retq
  400567:    66 0f 1f 84 00 00 00     nopw   0x0(%rax,%rax,1)
  40056e:    00 00

理論分析

第一次進入

foo

函數前後

徹底弄懂為什麼不能把棧上配置設定的數組（字元串）作為傳回值背景基礎預備實驗回到主題

在進入

foo

函數之前，因為

main

裡沒有參數也沒有局部變量，是以，main 的棧幀的長度就是0，

rbp

和

rsp

相等（

0x7fffffffe2c0

）。當執行

callq  40052d <foo>

會把

main

函數的在調用

foo

之後需要傳回執行的下一行代碼的位址壓棧，因為是64位機器，位址8位元組。

進入

foo

之後

push   %rbp

把

rbp

的值壓棧，因為也是存的位址，是以又占了8位元組，是以當初始化

foo

函數的

rbp

的時候

mov    %rsp,%rbp

rsp

已經在原來的基礎上加了

位元組，是以從

0x7fffffffe2c0

變成了

0x7fffffffe2b0

sub    $0x10,%rsp

因為

foo

函數裡面局部變量，編譯的時候就預留了

位元組，是以

rsp

變為了

0x7fffffffe2a0

最後執行了

movl   $0x29a,-0x4(%rbp)

将

放在了

0x7fffffffe2ac

，當第二次調用的時候，列印

的彙編代碼如下

printf("%d\n", i);
  400535:    8b 45 fc                 mov    -0x4(%rbp),%eax
  400538:    89 c6                    mov    %eax,%esi
  40053a:    bf 00 06 40 00           mov    $0x400600,%edi
  40053f:    b8 00 00 00 00           mov    $0x0,%eax
  400544:    e8 c7 fe ff ff           callq  400410 <printf@plt>

第二次進入

foo

因為上次

-0x4(%rbp)

存了

，而第二次調用

foo

的

rbp

的值又和第一次一樣，是以是一個位址。是以

就被列印出來了。

回到主題

#include <stdio.h>
#include <stdlib.h>
#include <string.h>

char *parse_scheme(const char *url)
{
    char *p = strstr(url,"://");
    long l = p - url + 1;
    char scheme[l];
    strncpy(scheme, url, l-1);
    printf("%s\n",scheme);
    return scheme;
}

int main()
{
    const char *url = "http://static.mengkang.net/upload/image/2019/0907/1567834464450406.png";
    char *scheme = parse_scheme(url);
    printf("%s\n",scheme);

    return 0;
}

調試資訊如下，當從

parse_scheme

傳回時，列印

scheme

的結果還是

http

，但是當我們調用

printf

之後，和上面樣例中一樣，

parse_scheme

出棧，

printf

入棧，則棧上記憶體就又替換了，是以列印出來的結果則不一定是

http

了。

徹底弄懂為什麼不能把棧上配置設定的數組（字元串）作為傳回值背景基礎預備實驗回到主題

背景

基礎預備

實驗

理論分析

回到主題

繼續閱讀

字元數組,字元指針,sizeof,strlen總結

C++字元數組越界問題的一個案例分析

EasyUI DateTimeBox設定預設時間的注意點

SCCM TP4建立邊界和邊界組

2009 IT Annual Survey Result

存放字元串數組的兩種方法

vb 回車換行符分割字元串

一張圖看懂停車場的前世今生

關于 APP 預埋檢查政策優化

C++ 傳回字元數組的寫法

解決辦法：av_interleaved_write_frame()傳回-22 錯誤

YAML中多行字元串的配置方法總結

字元串轉數組