寫這個筆記的目的
1 為了考試友善複習,随時随地就可以開始複習
2 以後用到的時候友善找
3督促自己學習
筆記内容:老師上課的課件,中國MOOC中廈大開設的網課,吳喜之先生編寫的教材
希望能不忘初心,争取把時間序列寫完
文章目錄
- 1.1 時間序列分析的一般問題
-
- 1.1.1 時間序列的含義
-
- 時間序列的特點
- 1.1.2 時間序列的分類
- 1.1.3 時間序列分析差別于其他統計分析方法的特征
- 1.1.4 時間序列分析與數理統計學的主要差別
- 1.2 時間序列基本樣式
-
- 1.2.1 平穩時間序列
-
- 1.2.1.1 白噪聲時間序列
- 1.2.2 非平穩時間序列
-
- 确定性趨勢時間序列
-
- 線性趨勢時間序列
- 指數趨勢時間序列
- 随機趨勢時間序列
- 季節性時間序列
- 條件異方差
- 異常值
- 1.3 時間序列分析工具
1.1 時間序列分析的一般問題
1.1.1 時間序列的含義
- 統計意義:就是将某一個名額在不同時間上的不同數值,按照時間的先後順序排列而成的數列。
-
數學意義:如果我們對某一過程中的某一個變量或一組變量X(t)進行觀察測量,在一系列時刻t_1,t_2…t_N(t為自變量,且t_1<t_2<t_3<…<t_N),得到的離散有序數集合X_t1,X_t2,…,X_tN稱為離散數字時間序列,即随機過程的一次樣本實作。
設X(t:t ∈ \in ∈T)是一個随機過程,X_ti(i=1,2,…,)是在時刻i對過程X(t)的觀察值,則X_ti(i=1,2,…)稱為一次樣本實作,也就是一個時間序列。
-
系統意義:時間序列就是某一系統在==不同時間(地點,條件等)==的響應。
這個定義從系統運作的觀點出發,不僅指出時間序列是按一定順序排列而成的,這裡的一定順序既可以是時間順序,也可以是具有各種不同意義的實體量,如代表溫度,速度或其他單調遞增地取值的實體量。
時間序列隻強調順序的重要性,而并非強調必須以時間順序排列。
時間序列的特點
1.序列中的資料/資料點的位置依賴于時間,即資料的取值依賴于時間的變化,但不一定是時間t的嚴格函數。
2.每一時刻上的取值或資料點的位置具有一定的随機性,不可能完全準确地用曆史值預測
3.前後時刻(不一定是相鄰時刻)的數值或資料點的位置有一定的相關性,這種相關性就是系統的動态規律。
4.從整體上看,時間序列往往呈現某種趨勢性或出現周期性變化的現象。
1.1.2 時間序列的分類
嚴平穩時間序列:時間序列的機率分布與時間t無關。
寬平穩時間序列:時間序列的一,二階矩存在,且對任意時刻t滿足(1)均值為常數,(2)協方差為時間間隔 τ \tau τ的函數。
非平穩時間序列:不具有平穩性即序列均值或協方差與時間有關的序列。
注:
- 如果沒有明确提出嚴平穩,那平穩指的就是寬平穩。
- 在教材中遇到的肯定都是平穩(寬平穩),如果是比賽賽題或實際情況那就需要判斷。
- 教材中所介紹的模型多數是假設服從高斯分布的時間序列模型,對于非高斯時間序列,可以通過變換,可近似看成非高斯時間序列。
為了對時間序列分析方法有一個比較全面的了解,現将時間序列分析的主要方法歸納如下:
注:時間序列分析方法如果按其采用的手段不同可概括為資料圖法,名額法和模型法三類。這裡說的采用的手段和上面思維導圖中的方法不一樣,不要混淆二者的概念。
資料圖法:将時間序列在平面坐标系中繪出坐标圖,根據圖形直接觀察序列的總趨勢和周期變化以及異常值點,升降轉折點。
評價:
- 方法簡單,直覺,易懂易用; 但擷取的資訊少且膚淺,分析結果的主觀性較大。
名額法:通過一系列核心名額來反映所研究系統的動态特征。
模型法:對給定的時間序列,跟據統計理論和數學方法,建立描述該序列的适應或最優統計模型,進而據以進行預測或控制。現大多分析時間序列資料都采用這種方法。
時間序列分析的基本特征就是研究序列随時間發展的模式
1.1.3 時間序列分析差別于其他統計分析方法的特征
(可與回歸分析相比較來了解這一小節的差別)
-
明确重視順序的重要性
時間序列與其他變量數列不同 ,序列中的觀察值是按照一定順序取得的,并保持其順序不變。這有這樣,才能保證所研究現象的曆史發展過程不改變。
-
時間序列中的觀察值之間存在着一定的依存關系
一般的統計分析方法,要求每一變量各自獨立,但是,由于任何現象的發展,一般都具有一定的慣性,因而,相應的時間序列中各時刻的觀察值之間就展現為一定的依存關系。從某種意義上說,時間序列分析就是要定量的描述這種依存關系。
-
在對所研究系統未來行為的分析即預測推斷的依據不同。
時序分析不是根據某一變量與其他變量之間的靜态相關關系來預測該變量的未來變化,而是根據預測變量本身或其他相關變量過去的變化規律來預測未來的變化。
1.1.4 時間序列分析與數理統計學的主要差別
-
數理統計學的樣本值是對同一随機變量進行n次獨立重複試驗的結果,或是n個互相獨立,同分布的随機變量序列的一個實作==;==而時間序列則是某一随機過程的一次樣本實作。
(這個馬馬虎虎可以了解)
-
在數理統計學中,進行統計推斷的目的主要是對一個随機變量的分布參數進行估計或假設檢驗;而在時間序列分析中,則是對某一時間序列建立統計模型。
(疑惑:時間序列模組化屬于統計推斷???)
- 數理統計學中的回歸模型描述的是因變量與其他自變量之間的統計靜态依存關系;而時間序列分析中的自回歸模型描述的是某一變量自身變化的統計規律。是某一系統的現在行為與其曆史行為之間的統計依存關系。
1.2 時間序列基本樣式
時間序列資料根據其資料特征,可分為兩大類,一類是平穩時間序列,基本樣式是白噪聲時間序列;另一類為非平穩時間序列,根據其具體的資料特征,其基本樣式包括趨勢性時間序列,季節性,條件異方差和異常觀測值等。
1.2.1 平穩時間序列
當一個時間序列滿足下面兩個條件,我們稱該序列是平穩的。
E ( X t ) = μ , t = 1 , 2 , . . . , T E(X_t)=\mu,t=1,2,...,T E(Xt)=μ,t=1,2,...,T
E ( X t − μ ) ( X t − k − μ ) = γ k , t = 1 , 2 , . . . , T 且 k = . . . , − 2 , − 1 , 0 , 1 , 2 , . . . E(X_t-\mu)(X_{t-k}-\mu)=\gamma_k,t=1,2,...,T且k=...,-2,-1,0,1,2,... E(Xt−μ)(Xt−k−μ)=γk,t=1,2,...,T且k=...,−2,−1,0,1,2,...
其中 μ , γ k \mu,\gamma_k μ,γk為常數。
1.2.1.1 白噪聲時間序列
定義:如果時刻t以前的資訊不能對時刻t的值X_t提供任何資訊,并且如果對X_t+h的最好預測值或期望等于0,那麼這樣的時間序列就是白噪聲時間序列。
簡而言之,白噪聲序列是零均值,同方差,不存在相關性。獨立同分布随機變量是一個白噪聲序列即
E ( a t ) = 0 , t = 1 , 2 , . . . , n E(a_t)=0, t=1,2,...,n E(at)=0,t=1,2,...,n
E ( a t 2 ) = σ 2 , t = 1 , 2 , . . . , n E(a_t^2)=\sigma^2, t=1,2,...,n E(at2)=σ2,t=1,2,...,n
E ( a t a s ) = 0 , t = 1 , 2 , . . . , n 且 s ≠ t E(a_t a_s)=0, t=1,2,...,n且s\neq t E(atas)=0,t=1,2,...,n且s=t
注:白噪聲序列隻是平穩時間序列中的一種,除白噪聲序列外,還有許多序列是平穩時間序列。
1.2.2 非平穩時間序列
- 根據序列的一階矩和二階矩分為均值非平穩和方差非平穩。
- 根據其具體資料特征,其基本樣式包括趨勢性時間序列,季節性,條件異方差和異常觀測值。
-
趨勢性又分為确定性趨勢時間序列(線性趨勢,指數趨勢)和随機性趨勢等
注:均值非平穩和方差非平穩會在就、下一章讨論,這一節隻會讨論根據具體資料特征劃分的非平穩時間序列。
确定性趨勢時間序列
當一個時間序列為均值非平穩,且均值可由一個特定的時間趨勢表示時,稱該序列為确定性趨勢時間序列。用一般的回歸模型描述為: y t = ∫ ( t ) + a t , t = 1 , 2 , . . . y_t=\int(t)+a_t, t=1,2,... yt=∫(t)+at,t=1,2,...
其中, ∫ ( t ) \int(t) ∫(t)表示為y_t中随時間變化的均值,a_t是y_t剔除趨勢性或周期性後的部分通常為平穩部分。
線性趨勢時間序列
y t = a 0 + a 1 t + a t , t = 1 , 2 , . . . y_t=a_0+a_1 t+a_t,t=1,2,... yt=a0+a1t+at,t=1,2,...
其中at是獨立同分布,且 E ( a t ) = 0 , E ( a t 2 ) = σ 2 E(a_t)=0,E(a_t^2) =\sigma^2 E(at)=0,E(at2)=σ2,a1與t相乘形成了一個線性時間趨勢
在a0,at不變時,a1度量了yt從一個時期到下一個時期的變化,即 Δ y t = y t − y t − 1 = a 1 \Delta y_t=y_t - y_{t-1}=a_1 Δyt=yt−yt−1=a1
指數趨勢時間序列
定義:當一個序列從一個時期到另一個時期的平均增長率為恒定時,服從指數趨勢。若時間序列為非線性的,常用指數趨勢能更好的逼近。
模型的建立:
- 首先建立線性趨勢的自然對數模型 l o g y t = β 0 + β 1 t + a t , t = 1 , 2 , . . . logy_t=\beta_0+\beta_1 t+a_t, t=1,2,... logyt=β0+β1t+at,t=1,2,...
- 然後兩邊指數化 y t = e x p ( β 0 + β 1 t + a t ) y_t=exp(\beta_0+\beta_1 t+a_t) yt=exp(β0+β1t+at)
其中at與線性趨勢時間序列中at相同。
随機趨勢時間序列
當我們可以用差分的方式去掉時間序列的趨勢性時,就稱序列具有随機趨勢。随機趨勢序列可以用下面的模型來表示,該模型又稱帶漂移的随機遊走模型:
y t = μ + y t − 1 + a t , t = 1 , 2 , . . . , T y_t=\mu+y_{t-1}+a_t, t=1,2,...,T yt=μ+yt−1+at,t=1,2,...,T
季節性時間序列
定義:對于給定的時間序列,當觀測值呈現出周期性變化規律時,就稱為季節性時間序列。
表現方式:
- 在某個季節的觀測值與其他季節的觀測值顯著不同;
- 時間序列的方差呈現周期性波動;
條件異方差
條件異方差是指時間序列的方差不再是常數,表現在時序圖上觀測值傾向于成群出現。
條件異方差更多出現與經濟時間序列,尤其是金融時間序列。
異常值
定義:對于一個給定的時間序列,如果一個或多個觀測值與其他觀察值有顯著的不同,就稱出現了異常觀測值,又叫離散點。
1.3 時間序列分析工具
老師上課講了SAS,eviews,但是都不會用,而且網上關于這兩個軟體的學習資料也比較少,是以我也不打算學,還是主用python和R,這才是現在統計分析的趨勢,