天天看點

智能投顧中的基礎核心,華爾街老司機手把手教你搭建智能資産配置模型

在接下來的系列課程中,王蓁博士即将帶來更加詳細、實踐化機器學習算法進階的教程,手把手教你搭建專屬的智能資産配置模型!為了讓更多人了解智能投顧,AI金融評論摘取本次課程的部分精彩内容回顧,希望能幫你窺探到課程的核心。

https://www.leiphone.com/special/mooc/03.html

雷鋒網AI金融評論報道,随着人工智能以不可阻擋的态勢漸漸滲透到我們日常生活的方方面面,在高度量化的金融投資領域,變革求新、提速高效的追求也催生了智能投顧作為AI全新産品的蓬勃發展。大量的金融科技、人工智能相關崗位的招聘和交易員、量化研究員崗位的消失正見證着這一AI新業态随着時代發展的嶄新面貌,那麼在着手建構智能投顧産品具體操作的過程中,該如何去建立核心模型這一“心髒部位”去投入運作?雷鋒網AI金融評論與AI慕課學院主辦的智能投顧配置特訓班講師王蓁特别指出,智能投顧整體模型的關鍵在于運算公式的建立和參數的估計。

以下是本次直播課程内容回顧:

今天是初級課程第三講,今天開始正式來介紹,各個資産配置模型具體的原理,以及我們應該怎麼在各個資産配置模型當中,去真正完成資産配置的操作。

今天我們會講兩個模型,第一個模型是美國也是世界第二大資産管理公司—先鋒(Vanguard)所使用的資産配置模型。先鋒在2016年介入智能投顧行業這個領域,它們的資産配置模型其實是對外采購的,我們先來看看這個資産配置模型的投資邏輯:

第一,假設投資周期是10年,或者更長的時間;

第二,假設投資的是美股的市場,也就是一個震蕩上行的市場。為什麼第二點這麼重要呢?是因為,美股是一個特殊的市場,像定投,或者長期投資,在美股市場是比較有效的;

第三點是假定市場有效,也就是巴菲特一直在說的,所有的投資不如買大盤,是以他們推崇的是被動式投資,做的是大類資産的配置。每一個大類資産配置當中,所選的标的不進行主動式管理,也不進行收益增強,而是純粹地跟随指數進行增長;

第四點是假定投資不會産生超額收益Alpha,是以說在這個邏輯之下,最大的考慮是降低交易的頻率和每一次交易下的交易費用。其實不止交易費用,在ETF和公募基金之間,也會選擇交易費用、維持費用比較少的。因為我們知道,共募基金有前端費用、後端費用,還有營銷費用、花費費率,以及管理費等等非常多的費用。ETF内部也有維持的費用,但是在考慮這些費用的情況下,一般來講,ETF要比公募基金要低很多。是以說,他們會選擇費用較低、維持成本和交易成本較低的标的來進行投資。

另外,他們采用了人工劃分投資者的辦法,并且人工標明了投資者的類型,大類資産是什麼樣的權重,以及通過人工确定,每一個大類下,他們認為的固定的,最優的有代表性的投資标的,也就是ETF。是以第五、第六、第七和第九點,考慮到頻率較低(具有可操作性),他們每年都會去做。

同時也是因為是長期投資,是以并不會在乎,今天買到的這個價格,是100元還是101元。

先鋒模型,本質就是人工定好每一項大類資産配置,又定好了每一大類資産的投資标的,然後再人工确定這樣的組合對應的特征,也就是風險等級,一一對應起來建成幾個大框。把這些大框放在一起,使用者一來就可以扔進去了。

課件上是一些例子,它們其實是根據投資周期的長短先進行劃分,我們在第一節課也提到了,使用者風險等級主要取決于兩個因素:一個是投資周期,一個是使用者的風險承受能力。使用者的風險承受能力可以進一步劃分為兩方面,就是使用者的客觀風險承受能力和主觀風險承受能力。使用者從資産端考慮,從最左邊到最右邊,随着投資周期的增長,股票在裡面占有的比例越來越大,債券占有的比例越來越小。下面的表格也寫着過去九十年的結果,這在中國是不可想象的。過去九十年的結果就是這樣,每一年5%,6%或者7%的收益,這是比較難以想象的。但是我們可以看到,整體來講,随着投資周期的增長,随着股票占有比例的逐漸增多,波動性加大,風險在提高的同時收益也在提高。

這是先鋒另外的一些配置,把使用者的需求分為幾個大的目标。你是想均衡型的,就看左邊的一列;或者是成長型的,就看右邊的一列。均衡型要比成長型保守,成長型更加的激進,比如一個剛步入職場的年輕人,先鋒可能會認為,他更适合一個成長型的配置。

以上就是先鋒的資産配置模型,所有工作都是純人工去做的,這和國内某知名智能投顧提供商一樣。這并不是我們真正想要的智能投顧。它的好處是什麼呢?政策原理簡單、透明,人工确定了所有的東西,是以你選的人非常厲害,是巴菲特之流,那麼你的收益就會很高。交易執行也非常簡單,一年一次,不存在調倉的考慮,所需的成本非常低,需要做的工作非常少。

但是它的缺點也非常明顯,成也蕭何敗也蕭何。如果你選的是巴菲特,你可以獲得比較好的收益,假如你随便選了一個國内的公募基金經理,那麼你就可能會虧得很慘。先鋒的這個資産配置模型,隻适合于美股市場。國内的市場,一方面存在着周期,另一方面投資的周期相對較短,其次是一個震蕩下行的市場,或者說長期來看沒有往上走的趨勢,與美股市場不一樣。國内市場不如美股市場有效,存在着超額收益,先鋒的這套資産配置模型的先決條件,在國内其實是不成立的。

好,重點來了。那我們該怎麼辦呢?下面就到了量化資産配置最為基礎的現代資産組合理論,馬克維茨模型,也叫均值方差優化。

我們講的MPV,Markowitz,還是MVO,其實它們都是基于同一套的理論,隻不過不同的人出于不同的習慣有不同的稱呼而已。我們接下來就會詳細地來講講,馬克維茨模型的的原理是什麼,它是如何去進行資産配置的,又是如何去融合不同的使用者風險等級的。

為什麼我要仔細去講這個模型呢?這個模型發轫于1952年,是一個很老的模型,雖然實用性值得商榷,但它卻是其他所有量化資産配置模型的基礎,相當于我們要學會1+1,隻有當我們學會了資産配置中的1+1以後,我們後續才會講1+2,1+3,但都是要有這個1+1的基礎。是以大家一定要對這個模型比較了解。

模型目标是什麼呢?是給定風險的收益最大化,或者是給定收益的風險最小化,這兩者其實是同一個意思。在數學上,我們追求效用的最大化,收益減去千分之五,乘以A,一般來說A為風險延誤指數,再乘以投資組合的方差,這裡面有兩項:第一項是投資組合的收益,為鼓勵項,再減去懲罰項,就得到效用。當我們把效用最大化的時候,我們就得到給定風險等級下的最優函數。因為給定風險下的效用最大化,證明了其他任何的資産配置都無法比現在這個組合成本效益最優。

我在這裡列舉了馬克維茨模型七個很重要的假設:

第一個假設是,風險是可預測的,并且收益是正态分布的。這一個假設,也是1952年馬克維茨在博士論文中提出的結論。

第二點假設是,效用是風險和激勵綜合作用下得到的函數。

并且是向邊際遞減的單調函數,也就是說收益越高,額外的每個機關收益帶來的快樂或者心理滿足感是越來越少的。當投資人是處于虧錢的狀态,年收益率為-5%的時候,他獲得了10%的收益達到了5%,這個時候他的心理滿足感是非常大的;而當他的年化收益率為80%的時候,同樣是給予他10%的收益達到了90%,這個時候他擷取的心理滿足感遠遠不及前者,效用函數的增加遠遠小于-5%到5%的滿意度,這就是所謂的編輯效用遞減。

第四點假設是所有的投資人都是風險厭惡型的。也就是說現在有兩個選擇,第一,我給你10塊錢,是完全确定的;另一個選項是50%的幾率會得到20塊錢,和50%的幾率不獲得金錢。理論上來講,兩者的數學期望都是10塊錢,一個風險中性的人對這兩個選項是無所謂的,他可以拿這10塊錢,也可以選擇後者。但是,基于這個假設,投資者都會選擇第一項,也就是風險更小的那項。雖然預期收益都是10,但是前者風險更小,它的收益是确定的,是以投資者都會選擇前者。

還有一個理性人假設,以及沒有投資費用和有效市場假設等等。

這個模型很簡單,它的輸入是三個元素:第一個是每一類資産的預期收益,也就是前面提到的收益項,第二個是每一項資産的标準差,也就是風險項,作為風險的衡量,第三個是各個資産之間的相關性,如果是多于兩個資産,就是相關性矩陣,來衡量資産之間的關系。

它的輸出是一個叫有效邊際的東西……接下來,王蓁開始教大家,在真正開始搭建馬克維茨這一個智能投顧中的基礎核心模型的時候,如何去做數學的組合計算。王蓁還會在該節課程中詳細講解,在含有和不包含無風險資産情況下,該如何計算得到有效前沿;還有,作為核心基礎的馬克維茨模型參數又是如何求得的呢?參數估計方法有哪些--有使用曆史樣本值;有使用多因子模型;還有使用Bootstrapping和貝葉斯估計,想知道它們是如何具體運算來求得模型參數,一點一滴建立起具體可行的模型的嗎?計算過程詳解和耐心細緻的指導都在智能投顧進階教育訓練班初級課程第三節當中!

王蓁最後總結道,今天(周二)講的模型公式比較基礎簡單,大家回去一定要注意複習。下一節課周四的BL(Black-Litterman)模型會涉及到更多的資料推導,會更複雜一些,也更有意思。

擷取更多内容,請點選:智能投顧進階特訓班:初級-進階 系統詳解,全網獨家

學員: 我的了解是 智能投顧實作的是 通過對使用者資産、使用者投資需求的分析形成的使用者風險偏好無差異曲線和資産組合相切實作的。使用者的風險偏好無差異曲線是怎麼得來的?

王蓁:在不同的模型當中有不同的實作方式。下一節課要講的BL模型有其他的實作方式,而在今天講的馬克維茲模型當中,通過引入一個使用者的風險偏好的變量,這個變量是一個非負數的實數。當該變量變大的時候,風險偏好會越來越低。我們在目标函數中直接引入風險偏好參數,對目标函數進行最優化求解,進而得到給定風險等級下最優的組合配比。下節課我們在講BL(Black-Litterman)模型的時候,我也會講如何加入使用者風險等級這個因素進去。

學員:能不能多多講解一下如何看懂課件裡的圖形和資料?

王蓁:課件裡的圖形有一些還可以忽略,不太重要。主要是公式,一定要了解透。比如如何通過多因子模型(APT)來估計,分解成各個因子後,因子的收益是可以通過其他途徑比如線性回歸得到的,這樣就可以通過兩個向量的內積得到預期收益,有了預期收益,推導求出協方差的矩陣就可以得出最後的結果了。

學員:如果要開發智能投顧,核心是否就是提供公式給研發同僚并實作?

王蓁:簡單來說,是的。稍微展開一下,實際我們在項目實施的過程當中,這些模型或者公式就是我們的研究成果。當我們有了這些公式之後,我們需要做的事情就是結合具體的資料,把它寫成一個實作流程的說明文檔而已。

舉個例子,如果我要使用曆史樣闆的估計值,來做馬克維茨模型的實作,那我會怎麼去寫清楚呢?我會告訴同僚,取過去三個月每天的資料,來求簡單算術平均得到一個值。開發的同僚不需要了解這是什麼,隻需要知道這是一個值即可。然後,再使用過去三個月每一天的這個值求得方差,和協方差的矩陣。獲得了之後,所有的參數和流程就齊全了。在這個過程中,可以做一個說明,說我們的資料是要什麼格式的,可能要做什麼樣的整理,計算和清洗,這些都是屬于資料擷取部門的工作。

但在研究的過程中,我們也是需要做一些這樣的工作。資料處理完了之後,去進行模組化的一個過程才是我們工作的核心。剛才講的第一步通過簡單算術平均求值是第一步,求協方差矩陣是第二步,那麼第三步就是設定好實際調查得出的風險變量後,将這些參數求得的值代入到建立的函數當中去。數值計算可以我們自己來求,也可以教研發同僚如何去求,求出來以後将這個極值傳回給我們,就完成了整體模型的全部步驟了。是以核心就是這整套公式的建立和參數該如何去估計,這是最難的一點。

學員:我們如何知道,市場上的智能投顧産品使用的是什麼模型?

王蓁:沒有辦法從表面的觀察得知,除非是對方告訴我們。比如說Wealthfront,号稱使用了Black-Litterman Model,比這節課的模型要複雜,我們下節課會講;比如說國内很多的智能投顧提供商,都會說自己采用的是基于馬克維茨模型的智能投顧系統。我們今天上完課的學員,不需要聽後面的課程,出去都可以帶領團隊,在兩三周内開發基于馬克維茨模型的智能投顧,效果如何暫且不管,但一定是基于馬克維茨理論開發的模型。

希望大家了解,所有智能投顧的核心或者門檻,都是在于需要計算的模型本身,其他資料之類的,在目前來說遠遠構不成門檻。原因就在于,現在國内懂智能投顧模型的人很少很少。

——————————————————————————————————————————————

更詳細的智能投顧以及量化投資實操系列特訓課程,詳解四大行實操智能投顧系統端到端的經典案例,教你利用人工智能算法搭建系統的智能投顧項目。

本文作者:吳陽煜

繼續閱讀