文章來源:https://blog.csdn.net/anshuai_aw1/article/details/82626468
1 先從離散型随機變量和連續性随機變量說起
對于如何分辨離散型随機變量和連續性随機變量,在賈俊平老師的《統計學》教材中,給出了這樣的區分:
如果随機變量的值都可以逐個列舉出來,則為離散型随機變量。如果随機變量X的取值無法逐個列舉則為連續型變量。
進一步解釋,離散型随機變量是指其數值隻能用自然數或整數機關計算的則為離散變量。例如,企業個數,職勞工數,裝置台數等,隻能按計量機關數計數,這種變量的數值一般用計數方法取得。反之,在一定區間内可以任意取值的變量叫連續變量,其數值是連續不斷的,相鄰兩個數值可作無限分割,即可取無限個數值。例如,生産零件的規格尺寸,人體測量的身高,體重,胸圍等為連續變量,其數值隻能用測量或計量的方法取得。
形象點來解釋:
畫一幅畫,左邊是梯子,右邊是斜坡。
像梯子一樣能說出有多少層的,可描述的,是離散型随機變量;
像斜坡一樣不能說出有多少層階梯,不可描述的,是連續性随機變量。
需要注意的是,實際操作中梯子的階高可能很小,看起來很像斜坡,需要放大看。

2 離散型随機變量的機率函數,機率分布和分布函數
在了解機率分布函數和機率密度函數之前,我們先來看看機率函數和機率分布是咋回事。
為什麼我們花這麼大的力氣去研究這個概念。因為它實在太重要了,為什麼呢?在這裡,直接引用陳希孺老師在他所著的《機率論與數理統計》這本書中說的:
研究一個随機變量,不隻是要看它能取哪些值,更重要的是它取各種值的機率如何!
這句是本文的核心内容,本文的所有概念,包括機率密度,機率分布,機率函數,都是在描述機率!
2.1 機率函數和機率分布
2.1.1 機率函數
機率函數,就是用函數的形式來表達機率。
pi=P(X=ai)(i=1,2,3,4,5,6)
在這個函數裡,自變量(X)是随機變量的取值,因變量(pi)是取值的機率。它就代表了每個取值的機率,是以順理成章的它就叫做了X的機率函數。從公式上來看,機率函數一次隻能表示一個取值的機率。比如P(X=1)=1/6,這代表用機率函數的形式來表示,當随機變量取值為1的機率為1/6,一次隻能代表一個随機變量的取值。
2.1.2 機率分布
接下來講機率分布,顧名思義就是機率的分布,這個機率分布還是講機率的。我認為在了解這個概念時,關鍵不在于“機率”兩個字,而在于“分布”這兩個字。為了了解“分布”這個詞,我們來看一張圖。
離散型随機變量的值和機率的分布清單
在很多教材中,這樣的清單都被叫做離散型随機變量的“機率分布”。其實嚴格來說,它應該叫“離散型随機變量的值分布和值的機率分布清單”,這個名字雖然比“機率分布”長了點,但是肯定好了解了很多。因為這個清單,上面是值,下面是這個取值相應取到的機率,而且這個清單把所有可能出現的情況全部都列出來了!
舉個例子吧,一顆6面的骰子,有1,2,3,4,5,6這6個取值,每個取值取到的機率都為1/6。那麼你說這個清單是不是這個骰子取值的”機率分布“?
長得挺像的,上面是取值,下面是機率,這應該就是骰子取值的“機率分布”了吧!大錯特錯!少了一個最重要的條件!對于一顆骰子的取值來說,它列出的不是全部的取值,把6漏掉了!
2.2 分布函數
說完機率分布,就該說說分布函數了。這個分布函數是個簡化版的東西!全名應該叫機率分布函數。
看看下圖中的分布律,這裡的分布律明明就是我們剛剛講的“機率函數”,完全就是一個東西。但是我知道很多教材就是叫分布律的。
機率分布函數就是把機率函數累加
我們來看看圖上的公式,其中的F(x)就代表機率分布函數啦。這個符号的右邊是一個長的很像機率函數的公式,但是其中的等号變成了小于等于号的公式。你再往右看看,這是一個一個的機率函數的累加!
發現機率分布函數的秘密了嗎?它其實根本不是個新事物,它就是機率函數取值的累加結果!是以它又叫累積機率函數!
機率函數和機率分布函數就像是一個硬币的兩面,它們都隻是描述機率的不同手段!
3 連續型随機變量的機率函數和分布函數
連續型随機變量的“機率函數”換了一個名字,叫做“機率密度函數”。
為啥要這麼叫呢?我們還是借用大師的話來告訴你,在陳希孺老師所著的《機率論與數理統計》這本書中,
如果這麼解析你還是不太懂的話,看看下面的這個公式:
機率密度函數用數學公式表示就是一個定積分的函數,定積分在數學中是用來求面積的,而在這裡,你就把機率表示為面積即可!
左邊是F(x)連續型随機變量分布函數畫出的圖形,右邊是f(x)連續型随機變量的機率密度函數畫出的圖像,它們之間的關系就是,機率密度函數是分布函數的導函數。
兩張圖一對比,你就會發現,如果用右圖中的面積來表示機率,利用圖形就能很清楚的看出,哪些取值的機率更大!是以,我們在表示連續型随機變量的機率時,用f(x)機率密度函數來表示,是非常好的!
但是,可能讀者會有這樣的問題:
Q:機率密度函數在某一點的值有什麼意義?
A:比較容易了解的意義,某點的 機率密度函數 即為 機率在該點的變化率(或導數)。很容易誤以為 該點機率密度值 為 機率值.
比如: 距離(機率)和速度(機率密度)的關系.
- 某一點的速度, 不能以為是某一點的距離
- 沒意義,因為距離是從XX到XX的概念
- 是以, 機率也需要有個區間.
- 這個區間可以是x的鄰域(可以無限趨近于0)。對x鄰域内的f(x)進行積分,可以求得這個鄰域的面積,就代表了這個鄰域所代表這個事件發生的機率。