天天看點

結合AlphaGo算法和大資料的量化基本面分析法探讨◆ ◆ ◆◆ ◆ ◆◆ ◆ ◆

結合AlphaGo算法和大資料的量化基本面分析法探讨◆ ◆ ◆◆ ◆ ◆◆ ◆ ◆

◆ ◆ ◆

本文是以郝伯特·西蒙的過程理性理論結合alphago算法步驟探讨量化基本面分析法的分析方式,而不是讨論如何使用量化基本面分析法預測公司股價。

量化基本面分析法(quantamental)将量化和基本面兩種方法結合起來,是近幾年随着市場電子化、大資料、自然語言處理技術快速發展産生的新的基本面分析法。現在已經是dt時代,發揮海量資料價值已成為可能。以下讨論都是假設已合法的收集相關資料包括交易、消費、關注度、gps、衛星資料等等。

一、基于大資料的量化基本面分析法的預測更準确嗎?

一般來說,我們會将整個經濟看作一個大的動态市場系統,其中又會分割為一些子市場系統,可以認為每一個子市場系統中參與方與相關變量彼此之間的聯系要比其他子系統中變量的聯系要更強些。是以每個子市場系統中的參與方以及變量獨立于其他子系統相對均衡動态移動。短期均衡及每個子系統顯著主導的行為往往是波動而不可預期的。但長期動态均衡往往是可預期的,雖然每個子系統中的變量一起動态移動,但保持了每個子系統間的相對均衡。從微觀角度考慮的時候現象是變化的,而從宏觀角度考慮時,現象是不變的。現在基于之前的資料假設,我們有了關于各個子市場系統方方面面的資料,自然可以更好地統計長期動态均衡中那些穩定的關系,進而得到更加可靠的基本面分析結果。

但與此同時,我們也能聽到另一種聲音。在《信号與噪聲》[1]書中,作者認為在大資料時代資訊量呈指數增長,需要驗證的假設也正在以同樣的速度增長。資料中那些有意義的因果關系組合少之又少,增長的速度也不及資訊本身的增長速度快。大多數資料都隻是噪聲。人們很難從幹擾他們的噪聲中分辨出有用的信号。資料展示給我們的通常都是我們想要的結果,而且我們通常也預設這種皆大歡喜的結果。作者納特•西爾弗還引用莎士比亞劇作中的話“人們照着自己的意思解釋一切事物的原因,實際上卻和這些事物本身的目的完全相反”。更大量資訊能幫助我們更準确的預測嗎?

當然我們知道,通過深度學習和大資料,一定能得到一個更優的模式識别效果。但前提是我們假設未來和曆史特征向量是符合同一機率分布。未來當然不會和曆史是同一機率分布,就像彼得·林奇說的“你無法從後視鏡中看到未來。”哈耶克也說過“我們做出的預測有可能被否定,因為他們隻具有經驗的意義。”這裡也不想用深度學習成果來證明大資料在預測方面的效用。

納特•西爾弗在其書中接下來說:”資訊隻有在恰當的環境下才會成為知識,沒有環境,我們就無法從噪聲中區分信号,不斷犯錯,不斷嘗試,這或許是貝葉斯定理應用起來最容易的一個原則:進行大量的預測。”[1]”貝葉斯定理告訴我們,任何時候獲得新資訊,我們都應該更新自己的預測。簡單地說就是,不斷犯錯,不斷嘗試。真正’擁有’大資料的公司,比如谷歌公司,并不會在建立模型的問題上花費太多時間。它每年會進行上千次實驗,并在真正的客戶身上檢驗它的想法。”[1]在谷歌等網際網路公司都會有完善ab測試架構,以友善不同功能快速部署ab測試,通過客戶使用效果回報不斷疊代完善功能。我們知道ab測試本質上是個分離式組間實驗,不斷擷取客戶回報既新資訊持續優化模型效果。同樣我們可以認為基于大資料的量化基本面分析法,不隻是用大資料補充之前基本面分析法所用資料不足,其也是通過量化和更及時的資料不斷修正預測模型的過程。

二、 基于過程理性的量化基本面分析法

接下來,将以郝伯特·西蒙的過程理性理論結合alphago算法步驟探讨量化基本面分析法的步驟[2][3]:

1.設想可選方案集合,以及可能後果集合。

還是基本面分析法經常需要分析的那些問題,包括上下遊、銷量、成本、利潤、财務比率等。設想不同預測值下的可選方案與可能後果。

2.評估可能後果集合的機率。

以上兩步,過程理性和貝葉斯定理要求基本一緻。都需要基于曆史統計得到各可選方案的機率。這種預測被稱作“初始觀點”。”從理論上講,我們希望将初始觀點建立在過去的經驗最好是社會經驗的集合之上。”[1]

3.改進預測的資料,獲得新資料,進而改進預測模型。

新資訊和原有資訊結合起來的理性過程也是應用了貝葉斯定理。同樣,基于大資料的量化基本面分析法可以更及時的收集最新資料以及結果回報來改進預測模型。

4.預測模型結果将會影響可選方案集合,以及可能後果集合,進而持續優化決策過程。

持續優化的預測模型,即是一個預期過程,可以進一步減少不确定性以及消剪了行動域即可選方案集合。這點本質上也是緩沖預測誤差影響,和量化中動态對沖,不斷調整風險敞口的方式是一緻的。

5.從可能後果集合中,根據預期目标,選擇滿意的可能後果集合子集。并從可選方案集合中得到滿意的可能後果集合子集對應的方案。

在alphago中使用蒙特卡羅樹搜尋(monte carlo tree search,mcts)結合估值網絡(value network)來做可選方案集合選取。其決策時也可以認為是符合過程理性的。比方alphago會走一步導緻赢面更小,但赢的機率更大的棋。這太不優雅了,但修改對局勢的期望,減少了搜尋時的空間。

而投資人、分析師會基于之前的經驗與直覺做這個決策。依托的是人類的長期記憶和人類個體和集體的學習能力。納特•西爾弗也認為從噪聲中區分信号既需要科學知識,也需要直覺,那是基于人類長期記憶的。郝伯特·西蒙對比過國際象棋世界冠軍十年間不同的下法,認為這是這是全部職業強選手的集體經驗而積累起來的知識的結果。專家和新手區分不僅僅是前者具有大量和多樣的資訊,而且是他的直覺經驗使他能發現他所面對的形勢中的熟悉模式,長期記憶中儲存大量的棋子的共同模式,通過識别這些模式,從長期記憶中重新找到大量相關資訊。

不論如何,這是一個過程決策,正如郝伯特·西蒙強調的“抉擇不是由問題的客觀特征所唯一确定的,而是取決于用來達到決策的啟發式過程。”[2]

三、結論

基于大資料的量化基本面分析不隻是彌補了公司季報時間上空白,也不隻是通過方方面面的資料提供更多特征得到更好的基本面分析預測結果。其本身也是一個符合過程理性的分析方式。介于其也是随着大資料的發展剛剛起步的新的分析方法,如何不斷借鑒量化、基本面分析法、大資料、機器學習等各方面的成果還有待進一步探讨。就像黃霑歌詞裡寫的“論武功 俗世中不知邊和高 或者 絕招同途異路”。

原文釋出時間為:2016-11-25

本文來自雲栖社群合作夥伴“大資料文摘”,了解相關資訊可以關注“bigdatadigest”微信公衆号

繼續閱讀