統計分析基礎 (二)機率事件關系與計算
1機率基礎知識
1.1 機率
機率,又稱或然率、機會率、機率(幾率)或可能性,它是機率論的基本概念。事件的機率是衡量該事件發生的可能性的量度。雖然在一次随機試驗中某個事件的發生是帶有偶然性的,但那些可在相同條件下大量重複的随機試驗卻往往呈現出明顯的數量規律。
1.2 随機試驗
試驗:對某種自然現象作一次觀察或進行一次科學試驗。例如:
:抛一枚硬币,觀察正面H、反面T出現的情況。
:将一枚硬币抛擲三次,觀察正出現的次數。
:抛一顆骰子,觀察出現的點數。
:記錄某城市120急救電話台一晝夜接到的呼喚次數。
:在一批燈泡中任意抽取一隻,測試它的壽命。
:記錄某一晝夜的最高溫度和最低溫度。
上面的試驗,具有以下特點:
1、可以在相同的條件下重複進行。
2、試驗的可能結果不止一個,但在試驗前可以知道所有可能結果。
3、試驗前不能确定哪個結果會出現。
擁有以上3個特點的試驗稱為“随機試驗”
1.3 樣本空間
對于随機試驗E,E的所有可能結果組成的集合稱為E的樣本空間,記為S。其中,S中的元素,即E的每個可能結果,稱為樣本點。
1、執行個體:抛一枚硬币,觀察正面H、反面T出現的情況:
=
H:字面朝上
T:花面朝上
2、執行個體:抛一顆骰子,觀察出現的點數:
=
3、執行個體:記錄某地鐵站某日上行等車時刻:
=
4、執行個體:記錄某一晝夜的最高溫度和最低溫度
=
其中
為平均溫度。
5、執行個體:從一批燈泡中任取一隻,測試其壽命
=
其中
為燈泡的壽命。
1.4 事件
事件:我們稱試驗E的樣本空間S的某個子集為E的随機事件,簡稱事件。一般用大寫字母A,B,C...表示。
基本事件:由一個樣本點組成的單點集,稱為基本事件。抛骰子中,骰子一共有6個基本事件。
事件發生:在每次試驗中,當事件中的某個樣本點出現時,稱這個事件發生。抛骰子中,如果抛得點數為4點,那麼我們可以稱事件A發生。
必然事件:在每個試驗中一定會發生的事件。抛骰子中,事件D:“點數小于等于6點”是必然事件。
不可能事件:在每個試驗中一定不會發生的事件,用∅表示。抛骰子中,事件E:“點數大于6點”是不可能事件。
1.5 事件關系
事件是一集合,因而事件間的關系與事件的運算自然按照集合論中的集合之間的關系和集合運算來處理。
1、圖1-1:包含關系,A⊂B事件B包含事件A,A事件的發生必導緻事件B發生。即,如果A⊂ B且B⊂A則稱A事件與B事件相等。
2、圖1-2:和事件,A∪B事件A事件發生或者B事件發生,至少有一個事件發生。則稱此事件為事件A與事件B的和事件記作A∪B(或A+B)。
3、圖1-3:積事件,A∩B且僅當事件A,B同時發生時,事件A∩B發生。A∩B也記作AB。
4、圖1-4:差事件,當A事件發生、B事件不發生事件A–B發生。
5、圖1-5:互斥事件,A事件不 能B事件同時發生,基本事件是兩兩互不相容的。事件為:A∩B= Ø
6、圖1-6:逆事件,每次試驗中,事件A、B必有一個發生,且僅有一個發生,A的逆事件記為B∪
=S,B∩
=Ø
1.6 關系定律
1、交換律:A∪B = B ∪A;A∩B = B∩ A
2、結合律:A∪(B∪C) = (A∪B)∪C;A∩(B∩C) = (A∩B)∩C
3、配置設定律:A∪(B∩C) = (A∪B)∩(A∪C)
A∪(B∩C)是黃色+藍色 (A∪B)是黃色+藍色+綠色 (A∪C)是黃色+藍色+紅色
4、配置設定律:A∩(B∪C) = (A∩B)∪(A∩C)
A∩(B∪C)是黃色 (A∩B)是藍色+黃色;(A∩C)是綠色+黃色;
5、德摩根律:
=
左圖:黃色部分表示:除AB區域以外的黃色區域
右圖:黃色部分表示:除AB積區域外的黃色區域
,即:黃色+綠部分表示
(A逆事件),黃色+藍色部分表示
(A逆事件)
1.7 事件運算
1、例1:抛硬币:
在
:中事件
:“第一次出現的是H”,即
= { HHH, HHT, HTH,HTT }
事件
:“三次出現相同的一面”,即:
= { HHH, TTT }
在
:中事件
:“壽命小于1000小時”,即:
={ t | ≤ t
1000 }
在
:事件
:“最高溫度與最低溫度相差10攝氏度”,即:
={ (x.y)| y – x =10,
≤x≤ y ≤
}
2、例2:事件運算:
∪
= { HHH, HHT, HTH, HTT, TTT } #
和
的和事件,兩個并集
∩
= { HHH } #
和
的積事件,兩個交集
-
= { TTT } #
和
的差事件,兩個差集
= {THT, TTH,THH} #
和
的逆事件,即不在
集合且也不在
集合
1.8 頻率
1、在相同的條件下,重複n次試驗,事件A發生的次數
稱為A發生的頻數,
稱為事件A發生的頻率。
從抛硬币的多次試驗結果可以看出,當試驗重複次數較少時,事件H(正面向上)發生的頻率在0到1之間随機浮動。但是,當試驗重複次數較多時,事件H發生的頻率卻圍繞着0.5上下波動,并逐漸地穩定于0.5。
2、實驗總結:
大量的試驗證明,當試驗的重複次數n逐漸增大時,事件A發生的頻率會逐漸穩定于某個常數P。這個P就是事件A發生的機率,用于表示在一次試驗中,事件A發生的可能性大小。記事件A的機率為P(A)
3、機率需要滿足的條件:
1. 非負性:P(A)≥ 0
2. 規範性:對于必然事件S,有P(S) = 1
3. 可列可加性:對于兩兩互不相容的事件
,
,
……即
•
=Ø ,i≠ j,i,j =1,2……,有P(
∪
∪……) = P(
)+ P(
)+ ……
如:抛3次硬币中:事件A:“正面向上次數是1”,事件B:“正面向上次數是2”,事件C:“正面向上次數是3”, 事件D:“正面向上次數至少是1”。
D = A∪B∪C,且A,B,C互不相容,則P(D)= P(A∪B∪C)= P(A)+ P(B)+ P(C)
4、性質:
1. P(Ø) = 0,不可能發生的機率,即為:0
2. 對于兩兩互不相容的事件 ,
,
,
…… 即
•
= Ø ,i≠ j,i,j =1,2……,有P(
∪
∪……) = P(
)+ P(
)+ …… + P(
)
3. 對于A,B兩個事件,若A⊃ B,則P(A -B) = P(A) - P(B);
4. 對于任一事件A,有P(A)≤ 1
5. 對于任一事件A,有P(A)= 1 – P(A)
6. 對于任一事件,有P(A∪B)=P(A)+P(B)-P(AB)(稱為加法公式) #機率P被加了兩次,是以需要減去一次
推廣:
P(
∪
∪
) = P(
)+P(
)+P(
)–P(
)–P(
∪
)–P(
∪
)+P(
)
7. 例:某公司随機抽取員工,已知抽取一名女員工的機率為0.5,抽取到24~34歲之間的員工機率為0.3,抽取到24~34歲之間的女員工0.2,那麼抽取到一名抽取到24~34歲之間員工,或者24~34歲之間員工女員工的機率是多少?
解:使用公式:P(A∪B) = P(A) + P(B) - P(AB),
記事件A = {抽取一名女員工},事件B = { 抽取到24~34歲之間的員工},
則P(A) = 0.5,P(B) = 0.3,則P(AB) = 0.2 #AB的積事件
根據工式:P(A∪B)=P(A)+P(B)-P(AB)= 0.5+0.3-0.2 =0.6
--以上為《統計分析基礎 (二) 機率事件關系與計算》,如有不當之處請指出,我後續逐漸完善更正,大家共同提高。謝謝大家對我的關注。
——厚積薄發(yuanxw)