天天看點

一篇文章看透母函數、矩、矩母函數聯系與差別一篇文章看透母函數、矩、矩母函數聯系與差別

矩母函數的暴力拆解,看完即懂==>>>

  • 一篇文章看透母函數、矩、矩母函數聯系與差別
    • 導讀
    • Party1:母函數
    • Party2:矩
    • Party3:矩母函數

一篇文章看透母函數、矩、矩母函數聯系與差別

矩母函數?是《機率論》裡面一個重要的定義,對統計學和目前AI底層的算法原理了解都是非常有幫助的。全文基于自己的了解,僅供社群朋友共同學習,文章不會羅列公式,對小白絕對友善。溫馨提示:數學大佬可以直接跳過不看哦~

導讀

矩母函數,英文全稱為Moment Generating Function,簡稱MGF。以下全文将基于自己對機率論的了解對矩母函數進行簡單的分析,盡努力地把母函數、矩、矩母函數以及特征函數解析清楚。這是一次随機過程的作業,不出意外,我是第一次看到這幾個名詞,不了解但是覺得很酷。先翻看百度百科以及維基百科的解釋吧,生成函數即母函數,是組合數學中尤其是計數方面的一個重要理論和工具。生成函數有普通型生成函數和指數型生成函數兩種,其中普通型用的比較多。形式上說,普通型生成函數用于解決多重集的組合問題,而指數型母函數用于解決多重集的排列問題。看完這解釋,我覺得感覺自己要上天了,歎息自己水準不夠了解不了百度高屋建瓴的诠析。經過這幾天的查資料文獻,現在做一下整理吧。接下來我将正式解釋母函數、矩、矩母函數的聯系與差別,我相信,看完以後至少會使得我們對矩母函數的了解有一個具體的模型概念。

Party1:母函數

對于母函數 。首先下面我會通過它的提出、母函數的公式以及母函數的應用這三個方面來解釋母函數。

  任何事物的提出都是有背景的,對于母函數的提出,我先舉個生活中的小例子:手上有兩個骰子,問:兩個骰子投擲出的點數相加等于6時有多少種可能?明顯口算就可以輕松得出答案,組合可能為(1,5)、(2,4)、(3,3)、(4,2)、(5,1),共5種。這個例子非常簡單,小孩子也能回答。好,我把例子稍微改動一下:現在我手上有100個骰子,全部骰子點數相加等于360點,問有幾種可能?這個手算可能會無聊而且耗時,但是實質上我們還是很容易地列出所有的組合可能的,畢竟跟上面的例子相比較僅僅是數目加倍罷了,也可以利用計算機程式設計很快得出答案。說了這麼久,有些人會覺得不屑,來終極目标來了。現在投擲m個骰子,要求所有骰子點數相加等于n,問:一共有幾種可能。這問題羅列法是沒辦法解決的,畢竟切入點也找不到。為了解釋母函數的提出背景,我先用特殊推導一般的方法。令m=2,明顯這時2≤n≤12,問題就是列出□+□=n的所有組合情況。那好,了解了情景,接下來我們把兩個骰子組合的點數相加看做一個政策問題,相當于先投一個,再投一個,并且用 X 1 、 X 2 … X 6 X ^1、X^2…X^6 X1、X2…X6分别表示單個骰子的所有可能情況。不妨把每個骰子點數的所有可能加起來然後再相乘試下,得到

  

( X 1 + X 2 + X 3 + X 4 + X 5 + X 6 ) ∗ ( X 1 + X 2 + X 3 + X 4 + X 5 + X 6 ) (X^1+X^2+X^3+X^4+X^5+X^6 )*(X^1+X^2+X^3+X^4+X^5+X^6 ) (X1+X2+X3+X4+X5+X6)∗(X1+X2+X3+X4+X5+X6)

= X 2 + 2 X 3 + 3 X 4 + 4 X 5 + 5 X 6 + 6 X 7 + ⋯ X 12 , =X^2+2X^3+3X^4+4X^5+5X^6+6X^7+⋯X^{12}, =X2+2X3+3X4+4X5+5X6+6X7+⋯X12,

    

仔細觀察,不難發現當結果中 X 6 X^6 X6前面的系數 5 恰好就是上面第一個例子的組合可能,不妨大膽猜想, X c X^c Xc前面的系數就是所有骰子的組合可能數,明顯,經過驗證,其他的情況也遵循這一規律,到此為止,母函數的提出背景以及母函數的提出意義已經解釋完畢,當然這裡我并沒有對母函數公式做推導,這隻是我對母函數公式做一個說明罷了。這裡,我們回到最初的問題:m個骰子投擲出n點有幾種可能?應用母函數概念得,

( X 1 + X 2 + X 3 + X 4 + X 5 + X 6 ) ∗ ( X 1 + X 2 + X 3 + X 4 + X 5 + X 6 ) * … ∗ ( X 1 + X 2 + X 3 + X 4 + X 5 + X 6 ) (X^1+X^2+X^3+X^4+X^5+X^6 )*(X^1+X^2+X^3+X^4+X^5+X^6 )*…*(X^1+X^2+X^3+X^4+X^5+X^6 ) (X1+X2+X3+X4+X5+X6)∗(X1+X2+X3+X4+X5+X6)*…∗(X1+X2+X3+X4+X5+X6)

= □ X 1 + □ X 2 + □ X 3 + □ X 4 + □ X 5 + ⋯ =□X^1+□X^2+□X^3+□X^4+□X^5+⋯ =□X1+□X2+□X3+□X4+□X5+⋯

展開得到:

G ( X ) = a 1 X 1 + a 2 X 2 + a 3 X 3 + ⋯ + a n X n + ⋯ G(X)=a_1X^1+a_2X^2+a_3X^3+⋯+a_nX^n+⋯ G(X)=a1​X1+a2​X2+a3​X3+⋯+an​Xn+⋯, G ( x ) G(x) G(x)則稱為系數 a 1 、 a 2 、 a 3 、 … 、 a n 、 … a_1、a_2、a_3、…、a_n、… a1​、a2​、a3​、…、an​、…的母函數。

Party2:矩

對于矩。首先引入“中國福利彩票”作為線索去講解,福利彩票我相信大多數人都買過,2塊錢,仔細觀察,中國的福利彩票真的太良心了,不僅僅是用2塊錢可以中5塊、100塊、甚至500萬,最重要是這彩票的價格根本不變啊。目前豬肉的價格熱度讨論很是劇烈,那就以豬肉近十年的統計結果為例,2008到2018年豬肉價格基本在14塊錢左右波動,在2016年的時候也曾經漲到25塊錢;同樣,再看下一線城市近十年的房價走勢,2008年平均1w每平方米左右,然後指數爆炸式上漲,到了2017年最低都3w每平方米,高的甚至達到8w每平方米,這物價增長速度簡直驚人。回到福利彩票,單價一直都是2塊錢,又可以中大獎,夠良心了吧。對于彩票,我們得知,5塊、100塊和500萬的中獎幾率分别為10%、0.5%和0.00001%,這樣我們可以把中獎金額-中獎機率做一個杠杆天平量化,天平中間0刻度表示中獎機率為0,兩端刻度表示中獎機率為1,杠杆上挂的“砝碼”重量表示中獎金額。根據實體公式得知

m 左 ∗ l 左 = m 右 ∗ l 右 m_{左}*l_{左}=m_{右}*l_{右} m左​∗l左​=m右​∗l右​                 

  雖然左邊500w的“砝碼”比右邊5塊的“砝碼”重,但是 l 左 ≪ l 右 l_{左}≪l_{右} l左​≪l右​,當 m 左 = 500 w , l 左 = 0.00001 m_{左}=500w,l_{左}=0.00001%,L_{右}=1 m左​=500w,l左​=0.00001時,根據上面實體公式知,求得 m 右 = 0.5 m_{右}=0.5 m右​=0.5塊。也就是說,中獎機率為0.00001%的500w,實際上就是等于中獎機率為1的 0.5塊錢,簡單來說,不确定的500w就僅僅等于确定的0.5塊錢。接着這個分析,把所有的不确定中獎金額轉化成确定的中獎金額有: 500 w ∗ 0.00001 500w*0.00001 500w∗0.00001%+100*0.5%+5*10%=1.5元,也就是說,每買2塊錢的彩票我們能确定的最多隻能中1.5塊錢。回過頭來看,那剛才說的彩票良心壓根一點都不良心啊!每買2塊錢就意味着我們将虧0.5元,買的越多,虧得也越多,簡直黑心啊。在《機率論》中,矩的定義為:

E [ x k ] = ∑ i = 1 n P i x k , k = 1 , 2 , 3... E[x^{k}]=\sum_{i=1}^{n}P_{i}x^{k},k=1,2,3... E[xk]=i=1∑n​Pi​xk,k=1,2,3...

則稱為 x 的 k 階 原 點 矩 , 簡 稱 k x的k階原點矩,簡稱k x的k階原點矩,簡稱k階矩。 P i 相 當 于 前 面 的 杠 杆 刻 度 長 , x k P_i相當于前面的杠杆刻度長,x^k Pi​相當于前面的杠杆刻度長,xk 這裡暫且作為一個整體,相當于杠杆上面挂的“砝碼”重量,從公式來看,求事件的矩即是相當于求該事件的期望。

  矩母函數的矩可以對事件作一評價量化。例如,評價一個人一輩子過得怎樣。有兩個資料,假設以時間段的無綱量數值為量化值:A前10年取得10成就,(10,80)區間取得30成就,(80,100)區間取得10成就;而B前10年取得20成就,(10,80)區間取得5成就,(80,100)區間取得925成就。根據矩的概念,當階數 k = 1 k=1 k=1時, 成 就 A = ∑ i = 1 n P i x k = 10 ∗ 10 + 70 ∗ 30 + 20 ∗ 10 = 2400 成就_A=\sum_{i=1}^{n}P_{i}x^{k}=10*10+70*30+20*10=2400 成就A​=∑i=1n​Pi​xk=10∗10+70∗30+20∗10=2400 點;同理, 成 就 B = ∑ i = 1 n P i x k = 10 ∗ 20 + 70 ∗ 5 + 20 ∗ 925 = 2400 成就_B=\sum_{i=1}^{n}P_{i}x^{k}=10*20+70*5+20*925=2400 成就B​=∑i=1n​Pi​xk=10∗20+70∗5+20∗925=2400 點。從1階矩的結果來看,雖然B中間漫長的70年期間僅僅隻有5點的成就,但是卻跟A最後的人生總成就結果一樣。然後不妨看下階數 k = 2 k=2 k=2時, 成 就 A = ∑ i = 1 n P i ( x k ) 2 = 10 ∗ 1 0 2 + 70 ∗ 3 0 2 + 20 ∗ 1 0 2 = 152000 成就_A=\sum_{i=1}^{n}P_{i}{(x^k)}^2=10*10^2+70*30^2+20*10^2=152000 成就A​=∑i=1n​Pi​(xk)2=10∗102+70∗302+20∗102=152000 點;同理, 成 就 B = ∑ i = 1 n P i ( x k ) 2 = 10 ∗ 2 0 2 + 70 ∗ 5 2 + 20 ∗ 92 5 2 = 396500 成就_B=\sum_{i=1}^{n}P_{i}{(x^k)}^2=10*20^2+70*5^2+20*925^2=396500 成就B​=∑i=1n​Pi​(xk)2=10∗202+70∗52+20∗9252=396500 點。從2階矩次元來看,兩人的結果竟然差了2.6倍左右。是以,在量化人一輩子的生活狀況可以分不同的次元來看,1階矩結果我們可以了解到兩人一生的獲得成果差不多,但從2階矩次元我們就可以了解A、B兩個人一輩子裡面更為細節的内容,暫且了解為生活的坎坷程度吧,明顯看出來B相對于A這一輩子來說落差要更大。

Party3:矩母函數

對于矩母函數。總結上面分析得知,母函數的定義為:

G ( X ) = a 1 X 1 + a 2 X 2 + a 3 X 3 + ⋯ + a n X n + ⋯ , G(X)=a_1 X^1+a_2 X^2+a_3 X^3+⋯+a_n X^n+⋯, G(X)=a1​X1+a2​X2+a3​X3+⋯+an​Xn+⋯,

G ( x ) 則 稱 為 a 1 、 a 2 、 a 3 、 … 、 a n 、 … G(x)則稱為a_1 、a_2 、a_3 、…、a_n 、… G(x)則稱為a1​、a2​、a3​、…、an​、…的母函數;

矩的定義為:

E [ x k ] = ∑ i = 1 n P i x k , k = 1 , 2 , 3... E[x^{k}]=\sum_{i=1}^{n}P_{i}x^{k},k=1,2,3... E[xk]=i=1∑n​Pi​xk,k=1,2,3...

接着根據《機率論》對矩母函數的定義:

M ( t ) = E ( e t x ) = ∑ i = 1 n p ( x i ) e t x = p ( x 1 ) e t x 1 + p ( x 2 ) e t x 2 + ⋯ + p ( x n ) e t x n . M(t)=E(e^{tx} )=\sum_{i=1}^{n}p(x_i )e^{tx}=p(x_1 ) e^{tx_1 }+p(x_2 ) e^{tx_2 }+⋯+p(x_n)e^{tx_n }. M(t)=E(etx)=i=1∑n​p(xi​)etx=p(x1​)etx1​+p(x2​)etx2​+⋯+p(xn​)etxn​.

  現在,我們以面帶點,先跟着講解的思維來推進。(你可以了解以下所做的都是基于恰好假設,堅持一下,後面你會覺得非常妙的!)

   N o w , Now, Now,先看連續情況下,對 M ( t ) = E ( e t x ) M(t)=E(e^{tx} ) M(t)=E(etx)求導得,

M ′ ( t ) = d E ( e t x ) d t = d ∫ − ∞ ∞ e t x f ( x ) d x d t M^{'}(t)=\frac{dE(e^{tx})}{dt}=\frac{d\int_{-\infty }^{\infty }e^{tx}f(x)dx }{dt} M′(t)=dtdE(etx)​=dtd∫−∞∞​etxf(x)dx​

⟶ 積 分 微 分 可 交 換 ∫ − ∞ ∞ d d t e t x f ( x ) d x \overset{積分微分可交換}{\longrightarrow}\int_{-\infty }^{\infty }\frac{d}{dt}e^{tx}f(x)dx ⟶積分微分可交換​∫−∞∞​dtd​etxf(x)dx

⟶ 對 t 求 導 , 與 f ( x ) 無 關 ∫ − ∞ ∞ x e t x f ( x ) d x \overset{對t求導,與f(x)無關}{\longrightarrow}\int_{-\infty }^{\infty }xe^{tx}f(x)dx ⟶對t求導,與f(x)無關​∫−∞∞​xetxf(x)dx

O k , ∗ 曙 光 即 将 來 臨 ∗ Ok,*曙光即将來臨* Ok,∗曙光即将來臨∗->>是以,當 t = 0 t=0 t=0時,

M ′ ( 0 ) = ∫ − ∞ ∞ x f ( x ) d x = E ( x ) M^{'} (0)=\int_{-\infty }^{\infty }xf(x)dx=E(x) M′(0)=∫−∞∞​xf(x)dx=E(x)

看出來了嗎,這就是上面 矩 概念的1階矩啊!!

  是以,t=0,當k=2時:

M ′ ′ ( 0 ) = ∫ − ∞ ∞ x 2 f ( x ) d x = E ( x 2 ) M^{''} (0)=\int_{-\infty }^{\infty }x^2f(x)dx=E(x^2) M′′(0)=∫−∞∞​x2f(x)dx=E(x2)

. . . ... ...

以此類推, t = 0 t=0 t=0時, M ( t ) M(t) M(t)的 k k k 階導就等于 E ( X ) E(X) E(X)的 k k k 階矩。離散的情況大同小異,這裡我直接給出來吧:

M ′ ( 0 ) = ∑ i = 1 n x f ( x ) d x = E ( x ) M^{'} (0)=\sum _{i=1 }^{n }xf(x)dx=E(x) M′(0)=i=1∑n​xf(x)dx=E(x)

看到這裡,想必我們已經對 矩母函數 有了很好地了解了,想繼續深入學習的話可以自行找資料補充,後續有時間的話我會繼續跟大家分享交流的。

繼續閱讀