linux下c/c++程式調試拾遺
以下為整理c++程式調試過程中經常用到的工具鍊
1. 調試利器GDB
linux下c++程式的調試,繞不過去的第一個就是gdb無疑了;
1.1 啟動gdb
gdb <pragram>
gdb <pragram> <core>
gdb <pragram> <pid>
gdb -pid/-p <pid>
注意:程式編譯時添加-g選項(有時候gdb調試core檔案,bt不出來函數調用堆棧時,百思不得其解之際,請檢查-g選項)
1.2 常用gdb調試互動指令
流程控制
- run: 可簡寫為r 運作
- next: 可簡寫為n 單步下一步
- continue: 可簡寫為c 繼續
- step: 可簡寫為s 單步下一步(若有函數調用進入函數内部)
- until: 循環體内部單步時,執行至退出循環,後也可跟行号(執行到指定行)
- finish:執行直至函數傳回
- call:後接可見函數,進行函數調用
- quit:退出
- layout src: 顯示源碼視窗,可以邊看代碼邊調試
斷點控制
- break 函數名 : 在指定函數處設定斷點,若為成員函數,指定類名如 b user::add
- break 行數: 在指定檔案代碼行數設定斷點如 b user.cpp:111
- break * if cond: 條件斷點如 b user.cpp:111 if enable = 1
- delete n:删除斷點n(斷掉号)
- disable n:暫停斷點n
- enable n:重新啟用斷點n
- info breakpoints:檢視所有斷點設定情況(info b)
- delete breakpoints 删除所有斷點
檢視運作資訊
- list:可簡寫為l 後接代碼行數n或函數名,檢視指定行數或函數處代碼,若後不接參數,接前面的list顯示
- print:可簡寫為p,列印指定變量、表達式、函數調用傳回值的值
- display :後接表達式,一旦設定,将會在每一步單步後自動列印表達式的值,使用undisplay n(配合info display使用)去掉列印
- watch:後接表達式,設定監察點,一旦表達式的值發生了改變,強行終止調試程式
- where/bt:檢視目前函數調用堆棧
- frame:後接函數調用幀ID,切換函數調用堆棧(後使用info frame檢視目前幀詳細資訊)
- info locals: 查詢目前函數堆棧幀所有變量
- up/down:改變函數堆棧深度
多線程調試
- info thread:用于顯示所有線程資訊
- thread apply ID1 ID2 command: 讓一個或者多個線程執行GDB指令command(如thread apply [ID] where 指令來檢視每個線程到底運作到了什麼地方)
- thread apply all command 讓所有被調試線程執行GDB指令command.(如 thread apply all bt檢視所有線程堆棧)
- thread [ID]:切換目前調試的線程
- break file.cpp:111 thread all:在file.cpp檔案111行設定斷點,對所有線程有效
- set scheduler off/on/step:off為預設值,所有線程均執行,on調試時隻有目前線程執行,step為單步的時候,隻有目前線程執行(除next:next經過一個函數,底層實作實際上是一個設定斷點然後continue的過程)
其它
- 諸如gdb當中設定變量及commond使用,可參照下面的參考資料
2.strace 跟蹤程序中的系統調用
strace常用來跟蹤程序執行時的系統調用和所接收的信号。 在Linux世界,程序不能直接通路硬體裝置,當程序需要通路硬體裝置(比如讀取磁盤檔案,接收網絡資料等等)時,必須由使用者态模式切換至核心态模式,通過系統調用通路硬體裝置。strace可以跟蹤到一個程序産生的系統調用,包括參數,傳回值,執行消耗的時間。
2.1. 輸出參數含義
每一行都是一條系統調用,等号左邊是系統調用的函數名及其參數,右邊是該調用的傳回值。 strace 顯示這些調用的參數并傳回符号形式的值。strace 從核心接收資訊,而且不需要以任何特殊的方式來建構核心。
$strace cat /dev/null
execve("/bin/cat", ["cat", "/dev/null"], [/* 22 vars */]) =
brk() =
access("/etc/ld.so.nohwcap", F_OK) = - ENOENT (No such file or directory)
mmap(NULL, , PROT_READ|PROT_WRITE, MAP_PRIVATE|MAP_ANONYMOUS, -, ) =
access("/etc/ld.so.preload", R_OK) = - ENOENT (No such file or directory)
2.2. 參數
-c 統計每一系統調用的所執行的時間,次數和出錯的次數等.
-d 輸出strace關于标準錯誤的調試資訊.
-f 跟蹤由fork調用所産生的子程序.
-ff 如果提供-o filename,則所有程序的跟蹤結果輸出到相應的filename.pid中,pid是各程序的程序号.
-F 嘗試跟蹤vfork調用.在-f時,vfork不被跟蹤.
-h 輸出簡要的幫助資訊.
-i 輸出系統調用的入口指針.
-q 禁止輸出關于脫離的消息.
-r 列印出相對時間關于,,每一個系統調用.
-t 在輸出中的每一行前加上時間資訊.
-tt 在輸出中的每一行前加上時間資訊,微秒級.
-ttt 微秒級輸出,以秒了表示時間.
-T 顯示每一調用所耗的時間.
-v 輸出所有的系統調用.一些調用關于環境變量,狀态,輸入輸出等調用由于使用頻繁,預設不輸出.
-V 輸出strace的版本資訊.
-x 以十六進制形式輸出非标準字元串
-xx 所有字元串以十六進制形式輸出.
-a column
設定傳回值的輸出位置.預設 為40.
-e expr
指定一個表達式,用來控制如何跟蹤.格式如下:
[qualifier=][!]value1[,value2]…
qualifier隻能是 trace,abbrev,verbose,raw,signal,read,write其中之一.value是用來限定的符号或數字.預設的 qualifier是 trace.感歎号是否定符号.例如:
-eopen等價于 -e trace=open,表示隻跟蹤open調用.而-etrace!=open表示跟蹤除了open以外的其他調用.有兩個特殊的符号 all 和 none.
注意有些shell使用!來執行曆史記錄裡的指令,是以要使用\.
-e trace=set
隻跟蹤指定的系統 調用.例如:-e trace=open,close,rean,write表示隻跟蹤這四個系統調用.預設的為set=all.
-e trace=file
隻跟蹤有關檔案操作的系統調用.
-e trace=process
隻跟蹤有關程序控制的系統調用.
-e trace=network
跟蹤與網絡有關的所有系統調用.
-e strace=signal
跟蹤所有與系統信号有關的 系統調用
-e trace=ipc
跟蹤所有與程序通訊有關的系統調用
-e abbrev=set
設定 strace輸出的系統調用的結果集.-v 等與 abbrev=none.預設為abbrev=all.
-e raw=set
将指 定的系統調用的參數以十六進制顯示.
-e signal=set
指定跟蹤的系統信号.預設為all.如 signal=!SIGIO(或者signal=!io),表示不跟蹤SIGIO信号.
-e read=set
輸出從指定檔案中讀出 的資料.例如:
-e read=3,5
-e write=set
輸出寫入到指定檔案中的資料.
-o filename
将strace的輸出寫入檔案filename
-p pid
跟蹤指定的程序pid.
-s strsize
指定輸出的字元串的最大長度.預設為32.檔案名一直全部輸出.
-u username
以username 的UID和GID執行被跟蹤的指令
2.3. 指令執行個體
跟蹤可執行程式
strace -f -F -o ~/straceout.txt myserver
-f -F選項告訴strace同時跟蹤fork和vfork出來的程序,-o選項把所有strace輸出寫到~/straceout.txt裡 面,myserver是要啟動和調試的程式。
跟蹤服務程式
strace -o output.txt -T -tt -e trace=all -p 28979
跟蹤28979程序的所有系統調用(-e trace=all),并統計系統調用的花費時間,以及開始時間(并以可視化的時分秒格式顯示),最後将記錄結果存在output.txt檔案裡面。
跟蹤網絡調用
strace -T -tt -e trace=network [lannch_command]
3. pstack 跟蹤程序棧
此指令可顯示每個程序的棧跟蹤。pstack 指令必須由相應程序的屬主或 root 運作。可以使用 pstack 來确定程序挂起的位置。此指令允許使用的唯一選項是要檢查的程序的 PID。請參見 proc(1) 手冊頁。
這個指令在排查程序問題時非常有用,比如我們發現一個服務一直處于work狀态(如假死狀态,好似死循環),使用這個指令就能輕松定位問題所在;可以在一段時間内,多執行幾次pstack,若發現代碼棧總是停在同一個位置,那個位置就需要重點關注,很可能就是出問題的地方;
示例:檢視bash程式程序棧:
/opt/app/tdev1$ps -fe| grep bash
tdev1 : pts/ :: -bash
tdev1 : pts/ :: -bash
tdev1 : pts/ :: grep bash
/opt/app/tdev1$pstack
#0 in __read_nocancel () from /lib64/libc.so
#1 in rl_getc ()
#2 in rl_read_key ()
#3 in readline_internal_char ()
#4 in readline ()
#5 in ?? ()
#6 in ?? ()
#7 in ?? ()
#8 in yyparse ()
#9 in parse_command ()
#10 in read_command ()
#11 in reader_loop ()
#12 in main ()
參考資料:
linux工具快速教程
gdb中應該知道的幾個調試方法