天天看點

中國人工智能學會通訊——金融博弈下的價值學習 1.2 資料分析和貝葉斯推斷

中國人工智能學會通訊——金融博弈下的價值學習 1.2 資料分析和貝葉斯推斷

我們對這個問題的另外一個考慮是現在的資料科學。統計學通常包含兩個部分,一個是學習;一個是統計推斷。在學習的部分收集資料,收集資料後有一個方案是對資料進行模組化。一種最簡單的模組化方式是均勻分布;另外一種經常用到的,特别是實體學、化學等自然科學用到的一種分布是高斯分布,還有經濟學最常用的幂次率。對于這些不同的分布,我們逐漸地知道它們越來越多的情況,可以說,我們有一個知其然的過程,正态分布我們知道有大數定律在裡面,是以我們也知道一些,但是對于幂次率我們并不是非常清楚的知道。

模組化以後還有一個統計推斷的過程,我們這裡做決策分析。回想一下機器學習很重要的幾個階段,也可以在這裡展現出來:第一,我們有了資料,然後模組化,把資料分成兩部分——訓練資料和測試資料,通過這兩個階段做決策分析。

整個的架構我們也許問過為什麼,但是需要比較嚴格的清清楚楚地将它仔細地分析一下。這裡我用一個貝葉斯優化的方案來探讨一個例子,目标是在金融和經濟學裡面見到的很多的,是将我們的期望收益最大化。