天天看點

實時股票分析系統的架構與算法

 原文位址:http://www.oschina.net/news/68824/open-source-reference-architectu

【編者的話】如果能在一台伺服器上應用人工智能和機器學習算法處理每天的股票交易,而自己則在夏威夷的海灘上享受生活,那将是多麼惬意呀。雖然股票 價格的變化受多種因素的影響,世上也沒有免費的午餐,但是有些公司依然能夠借助于開源的機器學習算法和資料分析平台得到“更好、更健康、更便宜的午餐”。 本文搜集并整理了一些如何實作實時股票分析系統的資料,從架構和算法兩個層面給出了一種可行的方案。

實時股票分析系統的架構與算法

從最頂層的視角看,由預測模型驅動的最優化實時股票預測架構包含資料存儲、模型訓練、實時評估和采取行動四部分:首先,進入系統的實時交易資料必須 被捕獲并存儲,作為曆史資料。第二,系統必須能從資料的曆史趨勢中學習,識别出影響決定的模式和機率。第三,系統需要能夠實時地将新傳入的交易資料與從曆 史資料中學到的模式和機率進行比較。最後,系統還需要預測出輸出并決定所要采取的行動。

實時股票分析系統的架構與算法

如圖所示,整個資料流包含6步,每一部分都是松耦合并且可以水準擴充的:

将訓練出的機器學習模型推送到部署好的應用程式上,同時更新 Apache Geode以便于進行實時預測和決策。

周期性地基于整個曆史資料集重新訓練并更新機器學習模型。這一步讓系統形成了一個閉環,當曆史模式發生變化或者新的模式出現的時候,它會持續地更新和提升模型。

實時股票分析系統的架構與算法

該解決方案中的每一個元件都責任明确,支援擴充并且能夠在雲環境中運作。那麼除了架構之外,針對影響股票價格的不同因素,應該選擇哪些算法來訓練模型并預測股票價格趨勢呢?

實時股票分析系統的架構與算法
實時股票分析系統的架構與算法