常見離散機率分布
伯努利分布(0 1分布)bernoulli destribution:一次獨立的實驗,成功機率為P。
二項分布 binomial destribution:n次獨立實驗,機率為P,成功k次的機率分布。
幾何分布 Geometric Distribution:在第k次獨立實驗時才取得第一次成功的機率,獨立成功次數為p。
泊松分布 Poisson Distribution:根據一段時間内的某時間平均發生次數λ推測一段時間内會發生某事件的次數k的機率。(前提:事件獨立;任意時間事件發生機率相同)
泊松分布的期望和方差均為 λ
離散型随機變量的分布函數稱為機率品質函數Probability Mass Function,PMF
連續型随機變量的分布函數為機率密度函數Probability Density Function,PDF
其中PMF PDF都是scipy.stats中的方法,例如:
伯努利分布
import scipy.stats as stats
import numpy as np
import matplotlib.pyplot as plt
X=np.arange(0,2,1)
p=0.5
plist=stats.bernoulli.pmf(X,p)
plt.bar(X,plist,width=0.1)
plt.title('Denoulli destribution p=0.5')
plt.xlabel('Random variable X')
plt.ylabel('Probability')
plt.xticks(X)
plt.show()
輸出結果
二項分布
import scipy.stats as stats
import numpy as np
import matplotlib.pyplot as plt
p=0.5
n=5
X=np.arange(0,n+1,1)
plist=stats.binom.pmf(X,n,p)
plt.bar(X,plist,width=0.1)
plt.title('Binom destribution p=0.5 n=5')
plt.xlabel('Random variable X')
plt.ylabel('Probability')
plt.xticks(X)
plt.show()
幾何分布
import scipy.stats as stats
import numpy as np
import matplotlib.pyplot as plt
k=5
p=0.6
X=np.arange(1,k+1,1)
plist=stats.geom.pmf(X,p)
plt.bar(X,plist,width=0.1)
plt.title('Geometric Distribution p=0.6')
plt.xlabel('Random variable X')
plt.ylabel('Probability')
plt.xticks(X)
plt.show()
泊松分布
import scipy.stats as stats
import numpy as np
import matplotlib.pyplot as plt
#某市一個月意外失蹤人數均值為5,圖示失蹤0-7人機率
mu=5
k=7
X=np.arange(0,k+1,1)
plist=stats.poisson.pmf(X,mu)
plt.bar(X,plist,width=0.1)
plt.title('Posson Distribution mu=5')
plt.xlabel('Random variable X')
plt.ylabel('Probability')
plt.xticks(X)
plt.show()
常見連續機率分布
正态分布The normal Distribution
幂律分布Power-law Distribution:展現在長尾效應,28法則,馬太效應等作用領域。
啟發:
1.之是以有些事件以幂律分布存在,是因為人會有選擇得做一些事情,進而打破正态分布。在學習中,也應該有選擇,有優先的處理一些事情。
2.對于一些邊際成本不斷下降的事情——如出書,做知乎live,投入一次,後續成本幾乎為0,但是可以帶來持續收益。