天天看點

量化簡史(從公式到人工智能)

在遇到同花順iFind之前,星空君學過一段Python,然後用幾個免費的資料庫爬取資料,實作了财報資料和交易資料自動入庫,然後形成想要的分析報表。

後來發現某網站搞量化政策征集,就去注冊了個賬号,系統的了解了一下目前的量化情況。

所謂量化,就是依托于計算機技術的自動化交易。美股大約70%以上的交易量來自于量化,A股資料不是非常透明,樂觀估計大約40%的交易量來自于量化。

公開資訊顯示,目前中國已知的規模前十的私募中,有一半是量化。

另一半,嘿嘿,星空君認為采用了量化3.0(什麼是量化3.0,見下文分解)。

需要注意的是,量化隻是一種交易方式,賺錢的是邏輯是模型,而不是交易方式,和是否量化無關。正确的邏輯和模型,無論是量化還是人腦,都會賺錢;不正确的邏輯和模型,無論是量化還是人腦,都不會賺錢。

在曆史的發展中,量化技術發生了根本性的變化,現在前沿的基于神經網絡的量化,和早期的量化,已經完全不是一個物種。

從實際操作來看,量化更适合高頻交易,人腦定性投資更适合低頻長期價投。

一、量化0.1,公式時代

很多炒股軟體會有一些公式,有的是軟體提供的警示點,有的是炒股高手定義的買入賣出點。

這就是最簡單的量化,邏輯清晰。

量化簡史(從公式到人工智能)

在Python的量化公式裡,這類買點、賣點非常多。

這是最初階的量化,但還不算量化,星空君定義為這是量化0.1。

二、量化1.0,因子時代

應該說,現在對量化有偏見的投資者,絕大多數對量化的認知,還停留在因子時代。

什麼是因子?

搞IT的都明白,無非就是一條if語句。

量化簡史(從公式到人工智能)

但中國的金融市場有個問題,除了金融工程專業畢業的,大部分财經專業都是學文的,缺乏理科思維。

對量化的認知,就缺乏理科思維。

而搞金融工程的,都在悶聲發大财。

星空君偷偷關注了一個量化協會,發現現在研究量化的頂尖人才,基本上是清北最高端的高科技人才。

他們對因子的研究,早已不是那麼簡單。

比如是這樣的:微網誌情緒和股市波動情況的關聯分析。

量化簡史(從公式到人工智能)

他們不僅僅是對股票做量化,甚至把微網誌、抖音等社交媒體也搞了量化,利用大資料直接自動梳理和股價相關的因子… …

三、量化2.0,上雲時代

如果說1.0時代的計算主要依賴于伺服器,到了2.0就開始上雲了。

上雲的好處是:無限算力。

隻要徐翔能把他的投資邏輯表達出來,就可以落地,然後窮舉、上雲。

四、量化3.0,模型時代

比較有趣的是,量化3.0時代,可能有的量化不是量化。

如何了解呢?

隻要投資家的投資邏輯是穩定的、可複述的,那麼他表達出來的這個投資模型,就是量化。

量化簡史(從公式到人工智能)

不管是否接入計算機,哪怕他隻是一遍一遍的用人腦去投資,也是一種量化。

為什麼要把這種思維模式定義為量化?

是因為新的量化4.0時代來了:人工智能。

五、量化4.0,人工智能

曾經有傳言,阿爾法狗跑到A股來搞量化,然後虧損退出。

事實上這是一個謠言,一方面,阿爾法狗并沒有來A股;另一方面,基于阿爾法狗類似邏輯的神經網絡人工智能,正在美股大放異彩。

如果說1.0-3.0都是模拟、複制人的投資政策的話,那麼4.0就是另外一種玩法了:超越人腦,獨立思考。

以阿爾法狗下圍棋為例,當它大殺四方擊敗所有人類包括圍棋天才柯潔的時候,柯潔說了一句:我感到渾身都在顫抖,真的,寒冷地顫抖。我再也控制不住情緒,趕緊沖出對局室,找到一個無人的角落裡哭了起來。因為即将到來的3:0,這樣的結局對我來說實在是太絕望了。

為什麼會這樣?

量化簡史(從公式到人工智能)

因為後期的阿爾法狗,已經不再采用人類的下圍棋思路。

這是神經網絡機器學習的奇妙之處,你隻需要告訴它目标,它可以自主學習。依賴世界上最強的算力,它可以在最短的時間複盤人類曆史上所有記錄的炒股邏輯,然後自主學習。

我再舉個栗子,現在有一種新興的職業,叫人工智能訓練師。

比如,訓練師告訴AI,這是人臉,那也是人臉,這一個不是。

慢慢人工智能開始自主學習,然後自己開始學會了畫人臉。

比如下圖的左側,是人描繪的風景,右圖是人工智能根據“自己”的了解“畫”出來的圖。

量化簡史(從公式到人工智能)

事實上,即便是沒有輸入,人工智能也能夠通過自主學習畫出“想”要表達的畫面。

量化簡史(從公式到人工智能)

(清華人工智能團隊2018年作品,人工智能自主繪畫)

我想表達的是什麼?

每個炒股高手的每一次點選、買入、賣出的操作,如果被人工智能記錄了,然後再基于此去自主學習,把所有股民都當做人工智能訓練師,最終實作的量化交易,會是怎樣?

量化簡史(從公式到人工智能)

舉個例子吧:

有數億使用者的同花順。

同花順在智能語音、自然語言處理等技術應用研發取得較大突破,在語音識别領域發表的兩篇論文,被國際語音處理頂級會議INTERSPEECH 2020收錄;

閱讀了解團隊參加機器閱讀了解全球權威比賽SQuAD2.0獲得總排名第三,單模型第一的成績;

自然語言處理團隊參加全球對話系統技術領域頂級賽事DSTC9,獲得跨語言對話狀态跟蹤任務第一名。

有意思的是,SQuAD2.0這個比賽,科大訊飛、阿裡達摩院、谷歌和微軟亞洲研究院等知名機構都參加了,一家網際網路證券公司拿了前三和單項第一,你能想象其背後的野心嗎?

再給大家看看同花順釋出在年報裡的項目:

量化簡史(從公式到人工智能)

繼續閱讀