天天看點

《Stata統計分析與應用(第2版)》一3.3 條形圖、餅圖和箱線圖的繪制

本節書摘來自華章出版社《stata統計分析與應用(第2版)》一書中的第3章,第3.3節,作者 周廣肅,更多章節内容可以通路雲栖社群“華章計算機”公衆号檢視

條形圖、餅圖與箱線圖也是較為基本的統計圖形,本節将會利用zichan.dta資料講解這三種圖形的繪制。

條形圖是用矩形的長度來表示互相獨立的變量大小取值的統計圖形,它與直方圖雖看着相似,但是含義和用法卻相差甚遠。條形圖主要有兩種:一種是橫向的條形圖,另一種是縱向的條形圖。

繪制條形圖的基本指令語句為:

在這兩個指令語句中,第一個是用于繪制縱向條形圖,第二個用于繪制橫向條形圖。yvar是将要繪制圖形的變量,if是條件語句,in是範圍語句,weight是權重語句。

在繪制條形圖的過程中,需要指明所要展示的統計量,如果不指明統計量,則會預設顯示均值(mean)統計量,繪制條形圖可使用的統計量如表3.6所示。

《Stata統計分析與應用(第2版)》一3.3 條形圖、餅圖和箱線圖的繪制
《Stata統計分析與應用(第2版)》一3.3 條形圖、餅圖和箱線圖的繪制

下面着重講述一下條形圖的options選項的内容。

(1)stack選項

在繪制條形圖時,預設采用并排形式,然而有時可将具有多個y變量的統計量上下堆積而形成堆積條形圖。stack通常與percentage選項連用,這時縱軸的統計量預設是比例,總和通常為100%,即百分比堆積條形圖。

(2)blabel選項

blabel選項有兩個作用,一個是通過為條柱增添數值标簽增加圖形所顯示的資訊量,另一個是可以改變bar的名稱群組合。blabel選項的指令語句如下:

其中what表示blabel選項定義的内容,詳細内容顯示在表3.7中,[, where_and_how]定義blabel選項的位置和顯示方式,具體如表3.8所示。

《Stata統計分析與應用(第2版)》一3.3 條形圖、餅圖和箱線圖的繪制

例如,利用zichan.dta資料,進行條形圖的繪制。此資料為根據中國某市曆年統計年鑒得到的自來水産業資産構成資料(2000~2007年),其中year代表年份,current代表流動資産,solid代表固定資産,gross代表資産總額。完整的資料位于本書附帶CD光牒data第3章zichan.dta工作檔案中。

圖3.12是運用zichan.dta資料檔案中的資料繪制的流動資産current、固定資産solid和資産總額gross随時間變化的條形圖,所有設定均使用預設設定。指令語句為:

over(year)表示圖形按時間year進行分組繪制。

《Stata統計分析與應用(第2版)》一3.3 條形圖、餅圖和箱線圖的繪制

為使圖表的閱讀性改觀及突顯主題,我們可以對圖3.12進行一些改進:

将縱向條形圖改成橫向條形圖。

為每個條柱增加标簽,内容為條柱的高度,位置在條柱的右方。

在300000數值處畫一條辨別線。

重新輸入繪制圖形的指令如下:

在這個指令語句中,“graph hbar”表示繪制橫向條形圖,“blabel(bar, position(outside))”表示給條柱添加标簽,位置在條柱的右方,“yline(300000)”用于繪制一條辨別線。繪制完成後的圖形如圖3.13所示。

為了更加清楚地看到資産的結構,我們也可以将條形圖繪制成層疊的形式,指令如下:

這個指令與前面指令的最大不同就是加了stack選項,生成的堆積條形圖如圖3.14所示。

《Stata統計分析與應用(第2版)》一3.3 條形圖、餅圖和箱線圖的繪制

餅圖是用圓形及圓内扇形的大小表示總體中各部分所占比例的統計圖,通常用來表示各部分在總體中所占份額。繪制餅圖的基本指令為:

這三個指令語句表達的基本含義是一緻的,隻是在餅圖具體繪制時有所差別。varlist/varname表示将要繪制圖形的變量,if是條件語句,in是範圍語句,weight是權重語句,options選項的具體内容顯示在表3.9中。

《Stata統計分析與應用(第2版)》一3.3 條形圖、餅圖和箱線圖的繪制

例如,運用zichan.dta資料檔案中的資料繪制資産構成的餅圖,所有設定均使用預設設定,需要輸入的指令語句為:

current、solid是餅圖的變量,by(year)是将餅圖按時間分類繪制。指令執行以後,将繪制出如圖3.15所示的資産構成餅圖。

預設的餅圖不僅美觀性較差,而且反映的資訊也不是特别清楚,使用者可以進行以下修飾和改進:

添加圖形名稱為“資産構成圖”。

在每一個扇面上加上所占比例的标簽。

将代表流動資産的扇面突出顯示,且顔色設定為黃色。

plabel(_all percent, gap(9))為每個扇面添加比例标簽,同時設定了相對位置,pie(1, explode color(yellow))使得第一個扇面向外凸出,且顔色設定為黃色,“title(資産構成圖)”命名了标題。改進後的餅圖如圖3.16所示。

《Stata統計分析與應用(第2版)》一3.3 條形圖、餅圖和箱線圖的繪制

箱線圖,顧名思義是由箱子和線段組成的圖形,用一條線段的兩端分别代表變量的最小值和最大值,中間一個箱子分别标明了第1個四分位數、中位數和第3個四分位數,是以一個箱線圖是5個統計量的彙總。箱線圖反映了資料的中心、分布、極端值的情況,是以在比較不同的資料集時較為常用。箱線圖有兩種:一種是縱向的箱線圖,另一種是橫向的箱線圖。箱線圖繪制的基本指令如下:

graph box用來繪制縱向箱線圖,graph hbox用于繪制橫向箱線圖。yvars是将要繪制箱線圖的變量,if是條件語句,in是範圍語句,weight是權重語句。

例如,運用資料檔案usaauto中的資料繪制價格price和重量weight的箱線圖,所有設定均使用預設設定,需要輸入的指令語句為:

指令執行以後,将繪制出如圖3.17所示的反映price和weight情況的箱線圖。

我們可以進行以下修飾和改進:

按國産車和進口車分别顯示這兩個變量的資訊。

将分組後x軸的組名分别命名為“國産車”和“進口車”。

“over(foreign, relabel(1 "國産車" 2 "進口車"))”即實作了按foreign變量分組,且将組命名,顯示的結果如圖3.18所示。

《Stata統計分析與應用(第2版)》一3.3 條形圖、餅圖和箱線圖的繪制

繼續閱讀