天天看點

《Stata統計分析與應用(第2版)》一1.2 Stata視窗及基本操作

本節書摘來自華章出版社《stata統計分析與應用(第2版)》一書中的第1章,第1.2節,作者 周廣肅,更多章節内容可以通路雲栖社群“華章計算機”公衆号檢視

本節将介紹stata的視窗組成和基本操作,讀者在這裡将逐漸熟悉stata的操作界面與方法。

stata軟體安裝完成後,運作stata,将會看到如圖1.1所示的操作界面。

《Stata統計分析與應用(第2版)》一1.2 Stata視窗及基本操作

從圖1.1中可以看出,stata菜單欄主要包括file、edit、data、graphics、statistics、user、window、help這8個子菜單。由于stata主要是通過指令進行操作,是以這裡隻是簡要介紹一下各個菜單的功能。

file的下拉菜單包括打開、儲存、浏覽、輸入、輸出以及列印等功能,如圖1.2所示。

edit的下拉菜單包括資料的複制、粘貼等有關資料管理和設定的功能,如圖1.3所示。

data的下拉菜單包括資料描述、資料編輯器、資料浏覽、變量設定、矩陣運算等方面的内容,如圖1.4所示,具體操作案例将在本書第2章中詳細介紹。

《Stata統計分析與應用(第2版)》一1.2 Stata視窗及基本操作

graphics是制圖菜單,制圖種類主要包括散點圖、點狀圖、柱狀圖、餅圖等各種圖形,如圖1.5所示,具體内容将在本書的第3章中詳細介紹。

statistics是用來進行各種統計和計量分析的菜單,如圖1.6所示,主要包括線性回歸模型分析、時間序列分析、面闆資料分析等方面的内容。這部分内容是本書的重點,将會在第4章以後詳細介紹,由于統計和計量分析時通常采用指令操作,是以此部分菜單一般并不使用。

user主要是用來建構使用者自己的菜單,包括資料、圖表和統計等方面的設定和操作,如圖1.7所示。

《Stata統計分析與應用(第2版)》一1.2 Stata視窗及基本操作

window是對顯示界面的操作,包括對review、results、variables、command幾大視窗的操作,如圖1.8所示。

help為幫助菜單,對使用者未知的功能提供簡單的幫助,如圖1.9所示。

《Stata統計分析與應用(第2版)》一1.2 Stata視窗及基本操作

在stata操作界面中,最主要的部分由4大視窗組成,分别是指令回顧視窗(review)、結果視窗(results)、變量視窗(variables)和指令輸入視窗(command)。

指令回顧視窗(review):用于臨時性存儲已經執行過的指令語句。這些執行的指令語句主要包括兩種:一是直接從指令視窗中輸入的指令,另一種是通過視窗菜單操作轉化而成的指令。review視窗可以臨時性存儲自stata本次運作到結束的所有指令,若stata中途或最終被關閉,則所有的指令語句将會自動消失,若想永久儲存這些指令,可以通過使用log指令或單擊右鍵實作存儲。在stata運作過程中,可以重複使用顯示在review視窗中的指令,隻需要左鍵單擊指令,該指令将會重新顯示在command視窗中。

結果視窗(results):用于顯示指令執行結果的視窗。若指令執行的結果過長,則會在指令視窗的底端出現“more”這一字樣,按下空格鍵或者Enter鍵,可以浏覽下面的内容;要想停止浏覽,按“q”鍵或者工具欄中的圖示則可。

變量視窗(variables):用來顯示變量名稱和類型的視窗。同樣點選某個變量名稱,就可以将其顯示在右方的指令視窗中。如果想要删除某個變量,在指令視窗中輸入drop指令,滑鼠左鍵單擊相應的變量名稱,然後按Enter鍵即可完成操作。

指令輸入視窗(command):使用者進行互動式程式操作的主要實作場所。在此可輸入相關指令,然後按Enter鍵即可。各種功能的相應指令将會在以後章節中詳細介紹。

stata為使用者提供了強大的幫助系統,新使用者可以通過幫助系統的應用,更好地利用stata完成自己所需要的功能和操作。stata的幫助系統主要由stata手冊、stata自帶幫助和stata網絡幫助三部分組成,下面我們将一一進行介紹。

stata手冊

stata手冊是一本學習stata使用的權威書籍,它按字母順序排列出了stata所有相關的指令。每一條指令不僅包括了其基本文法,還有具體操作執行個體、參考文獻的說明,十分詳細。但是對于中國使用者來說,其缺點也不言而喻,stata手冊數量龐大、價格昂貴,且用英語書寫,對于英語欠佳的讀者來說,使用極為不友善。

stata自帶幫助

使用stata自帶幫助系統是最友善,也是最常用的方法。我們有兩種方法可打開其自帶的幫助系統:一種是從菜單欄中選擇help中的stata command選項,然後在彈出的對話框中輸入所要查詢的指令語句即可;另一種是更為常用的方法,即使用help指令,其文法格式為:

help [所要查詢指令]

例如,我們想要知道非線性檢驗語句testnl的使用方法,就可以在指令視窗中輸入help testnl這一指令,然後按Enter鍵即可顯示如圖1.10所示的結果。

《Stata統計分析與應用(第2版)》一1.2 Stata視窗及基本操作

從圖1.10中可以看出:指令執行結果包括title——查詢内容,syntax——指令格式(文法),description——指令描述,options——選項,examples——示例等主要内容,通過對查詢結果的閱讀,即可了解該指令的使用方法。

stata網絡幫助

stata的網絡幫助系統更為強大,使用者可以在網上查找stata還沒有内置化的指令,實作自行安裝。執行指令有兩個,功能一緻,具體如下:

findit [所查找指令], net

search [所查找指令], net

之後就可以按照提示指令進行下載下傳安裝了。

此外,使用者還可以利用一些網站資源實作stata的更好利用,以下是一些極好的資源:

掌握stata的基本文法和指令,是熟練應用stata做統計或計量分析的基礎。首先,來了解一下stata的基本指令語句的格式,具體形式如下:

[by varlist:] command [varlist] [=exp] [if exp] [in range] [weight]

[using filename] [, options]

“[]”中的内容表示可以省略的部分,是以我們可以看出,隻有command是必不可少的,其他部分的内容可以根據自己的需要進行選擇。下面詳細介紹一下主要部分所代表的含義。

varlist

varlist代表一個或多個變量,如果想表示多個變量,各個變量中間必須用空格隔開。對于已經存在的變量在調用時,使用者可以使用一定的規則起到簡化的作用,如使用“?”代表單個字元,使用“*”代表任意字元,使用“-”代表兩個變量間的所有變量。然而對于新生成的變量來說,變量的名稱不能進行簡化。變量名稱可以由字母、數字、下劃線的組合構成,但是長度不能超過32位,當然名稱不能以數字開頭,也不能以單獨的數字組合命名。

by varlist

varlist是分類操作的指令,表示對分類變量中不同的類别分别進行操作。下面将通過一個簡單的例子示範一下這個指令的使用方法。

例題:利用美國1978年的汽車資料,計算一下美國汽車價格的總體平均值,以及進口車價格的平均值和國産車價格的平均值(資料檔案:usaauto)。

計算總體價格的平均值較為簡單,隻需輸入如下指令:

use auto, clear

summarize price

執行之後我們就可以得到如圖1.11所示的結果。

《Stata統計分析與應用(第2版)》一1.2 Stata視窗及基本操作

從結果顯示中可以看出,這個指令求出了所有74個樣本的價格均值為6165.257(機關:美元)。

現在來分别計算進口車與國産車的價格均值,此時就可以用上剛才講到的分類操作指令了,具體的指令語句如下:

by foreign: summarize price

這個語句的意思就是按照foreign這一分類變量将所有汽車劃分為國産車與進口車,然後分别求出其價格的均值,結果如圖1.12所示。

《Stata統計分析與應用(第2版)》一1.2 Stata視窗及基本操作

從結果中我們可以看出,國産車樣本有52個,價格均值為6072.423,進口車樣本有22個,價格均值為6384.682。

command

command指令應用較多,也是此書介紹的主要内容,我們将在後面章節的相關内容中一一介紹。需要注意的一點是,在輸入指令時可以在不産生歧義的前提下,盡量簡寫前幾個字母。例如上面例題中的summarize指令,可以簡寫為sum。

“=exp”和“if exp”

“=exp”是指派語句,“if exp”是條件表達式。所涉及的函數有多種,在相關章節中将詳細介紹。

in range

range主要用來表示觀測值的區間,篩選出相應的樣本,然後再執行相應的指令。表1.1列出了in range指令的使用方法。

《Stata統計分析與應用(第2版)》一1.2 Stata視窗及基本操作

weight

weight表示的是觀測值的權重,在權重最小二乘法中應用較多。權數的類型主要有抽樣權數、重要性權數、頻率權數、解析權數等。

options

options選項在很多指令中都有,但是根據不同的指令其options選項也不盡相同,是以這一部分的具體内容将會在相關指令中介紹。