天天看點

通聯資料CEO王政:人工智能如何作用于科學投資?

通聯資料CEO王政:人工智能如何作用于科學投資?

雷鋒網(公衆号:雷鋒網)3月13日報道,在日前于武漢舉辦的申萬宏源投資高峰論壇上,通聯資料王政就“投資科技與科學投資”做了主題演講。

王政,美國普林斯頓大學實體學博士,曾任巴克萊全球投資公司基金經理、博時基金股票投資部總經理、etf及量化投資總監等職,他擁有近20年資産管理、金融資訊平台研發和大資料研究經驗。

王政表示,投資科技是跨界的工作,需要把投資專業知識和邏輯與技術更好地結合起來,它需要具備幾個核心的要素:第一是一定要有專業的投資研究了解,隻有這樣了解的基礎上才能把技術用來解決投資中的問題。第二是需要有人工智能這樣的核心工具,幫助解決大資料時代中各種各樣的問題。

以下是王政演講内容,雷鋒網做了不改變原意的編輯:

今天我本來想用大的題目金融科技(fintech),這個東西太火了,但因為金融科技涉及面太廣,銀行、保險、支付等等,我今天主要是講投資科技與科學投資的關系。

為什麼叫投資科技(investech)呢,跟it有點差異性。投資科技的縮寫還是it,看起來沒有什麼差別,其實投資科技和it還是有本質差別的,it幫助我們解決工作上的一些問題,投資科技更多是跨界的工作,需要把投資專業知識和邏輯與技術更好結合起來。這裡面有幾個核心的要素需要具備:

第一是一定要有專業的投資研究了解,隻有這樣了解的基礎上才能把技術用來解決投資中的問題。

第二是需要有人工智能這樣的核心工具,幫助我們解決大資料時代中各種各樣的問題。

科技在投資領域的應用不是什麼新鮮的事情,早期我們用科技來提升資訊傳輸的速度,資訊對投資來講是非常重要的。随着計算機的發展,我們開始引入了計算機來傳遞資訊,也用計算機處理資訊、分析資訊。從70年代開始,投資管理在産品上有很多的創新,開始有指數基金,80年代有對沖基金,現在有智能投資和新的産品,随着科技發展應運而生,科技在幫我們引領産品的創新。

投資科技的核心基礎有三個技術非常重要,一是雲計算,二是大資料,還有最核心的人工智能。

雲計算幫助我們解決計算的能力和存儲路徑,在此能力基礎上我們才能夠采集更多的資訊,才能把更多的資訊存儲下來,才有我們現在講的大資料。

有了大資料之後,我們對用機器處理資料的需求越來越高,而且有這樣的樣本以後去學習的精确度會越來越提升。

大資料的産生歸納為三個次元:

第一個是關于物的資訊,我們記錄下各種裝置的位置。

第二個是關于人的資訊,每個人都有手機,這個手機有很多資訊,我們的位置,我們每天走了多少步,我們在什麼地方消費了,所有人的資訊都會被收集下來。

第三個是環境的資訊,低軌衛星的發展可以讓我們收集到更多環境的資訊,我們也和美國衛星采集公司合作,我們要看新疆光伏場地的資訊,不需要親自去了,用低軌衛星的照片就可以看到,每隔幾天掃描一次,可以幫助我們做更高層的研究。

大資料不僅僅是講資料多少的問題,更多是在資料的次元上擴充。

如果僅僅是行情資料,再高也就是一個類型的資料,如果我們有其他次元的資訊,對我們投資的幫助會更大。一般有兩類資訊,一類是和企業合作的專業資料,網際網路公司支付體系、營運商、商貿、物流、電力、大宗商品等企業存下來非常有價值的資料,以前沒有被我們所用,現在可以把這些資料用于投資,專業的資料需要通過合作引入到投資領域中,需要做一些脫敏。

公開資料,網上都可以看見,它的挑戰是什麼呢?需要技術把這些資料清洗幹淨處理好,為我們提供了多元度的資訊,同時及時性也提高了,可以通過高速的處理平台引入到我們的模型中。一個是廣度,一個是速度,為我們提供了更多的投資價值。

投資科技最核心的技術是人工智能,不僅僅是技術的更新,更多是改變我們服務的模式。有了人工智能,我們可以做很多場景化的服務,精準營銷可以知道某個點需要什麼東西,做研究和投資也是一樣的,機器可以幫助你識别一些感興趣的東西。服務的模式也會跟以前不一樣,有了人工智能以後,我們做智能投顧,完全是場景化、個性化的服務。

投資科技比較大的應用領域,投資科技比較大的應用領域,是智能投研和智能投顧,幫助大家提升效率,把基本面和量化結合來做研究,用于資産管理行業。

很多年前記得有一門課,最核心的一點就是從藝術到科學,所有模型都是用科學的方式來做,是以招了很多學理工科的做研究員。目的就是基于一定的投資邏輯建構出模型,能夠實證分析,不僅樣本有效,而且樣本外也可以有用。用非常嚴格的流程和方法來做投資,這就是早期量化投資在做科學投資很核心的點。我們做指數投資,其實就是科學投資的方法,隻是用了組合投資的概念。現在發展到新的階段,有點像組合的組合了。

随着技術的發展,量化投資的引入進入了工業時代的階段,我們會找一個團隊,有研究員,有做資料的,有做基金管理的,一個團體在科學的流程下完成投資管理任務。這個階段有點像工業時代的流水線,整個效率大幅度提升,重複性比主動投資強很多。

現在随着資料的增加,資料化程度提升,我們已經進入了資訊時代。資訊時代資料這麼多,存儲到各種各樣的資源上,如果想繼續用量化的方式一個個來建構,這個工作是非常大的,在座各位積累到那個程度需要很多的精力和時間。逐漸的,我們開始要借助技術,教機器去歸納和總結,機器沒有人這樣的創造性思維,但可以做很多以前人所思考的東西,智能投資機器的概念越來越流行。

概括來講,第一個階段不需要任何裝置輔助可以做投資,第二個階段可以教機器技能,就按照你交代它的事情去做。到現在,更多是想辦法教機器去學習,逐漸幫助我們提取我們所需要的知識和關系。

資訊處理上,每一個研究員會面臨着讀很多的公告,公告作為資訊的主要來源,每個研究員,無論是基本面還是量化的都會關注。每個公告來了都是一百頁甚至更長,怎麼樣把公告的資訊快速讀取,這是很有考驗的,但是機器可以幫助我們做文本處理,提取非常有價值的資訊。

第二,所有資訊來了以後有很多關聯關系,人去建立這樣的關系是可以的,但是精力不夠,機器就可以很快建立這樣的關聯關系,以及用模型幫你建立起關聯關系的強度。

第三是主題發現,我們經常做主題,怎麼樣從大量資訊挖掘出新的亮點和主題,我們無法從這麼多東西總結出特定的主題來,這些主題又和哪些公司有關系,這是我們很關注的,怎麼樣比對出這些公司來,這是文本方面。

第四,情緒分析,一篇文本資訊的情緒怎麼樣測算,一段語言的情緒怎麼樣測算,都是可以通過計算機來測算。

在這裡對科學投資的一點點個人了解和大家分享。

第一個是在理念上要有所改變。

我們要從傳統的量化投資向智能投資方向改變,不能簡單靠傳統研究各種各樣的模型,這個模型可能有價值,但随着資料的增加,這樣的工作會非常漫長。

以前的量化投資找市場共性工作流程,發展到研究某個行業、研究個股的模型,從共性到個性進行有規律的總結,每個股票也有規律。以前的模型資料比較好,ic比較高,但随着資料越來越多,資料資訊準确度越來越低。要從高ic到低ic,要接受ic比較低的信号,我們要通過很多的信号來選取ic。

此外是從單點到全局的轉變。原來我們看的都是定義名額,抽取每個股票單點資訊,盡管組合起來,但還是不夠全面,我們要從公司全貌來看。有些資訊可能還需要我們做非結構化到結構化的過程,我們希望把公司更全面的去看特征。

最後是從固定模闆到動态學習,原來一個模型可能是做好一直在運作,需要花很長時間修改模闆,未來學習機器幫助我們動态學習和提升。

第二,資料的次元上要改變思考。

首先,以前的資料都是特定的資料專而精,現在要朝着全樣本的角度發展,這樣會更加科學更加合理。

其次,以前的資料都是定時發生,現在要從定時發生的資料到實時發生,在我們的模型中去反映出來、展現出來,要求有動态反映實時資訊的能力。

再次,我們要接受低密度資訊的趨勢,以後很多很多的資訊密度會越來越低,以前是高含金量的礦石,現在是低含金量的礦石,怎麼樣從裡面篩取真正有價值的資訊,這需要投資科技幫助我們解決。

第三,要關注對平台的重視。

現在所有做量化的,還是傾向于自己建量化研究系統,但随着資料的增加,計算能力需求加大,所有的都是自己建,這種可能性越來越低。未來一定要共享外部資源,幫助你做很多事情,包括計算資源、存儲資源、資料資源,甚至你的信号都可以應用外面的信号,幫助你提升研究能力。

第二個是我們要接受公有雲的服務,以前什麼東西都是自己建設,用100個機器幫你模組化型不太現實,公有雲發展越來越成熟,也越來越安全。

第三個是從全方位到專業化,我們現在做投資什麼都要自己弄,其實把很多精力花在不應該的地方,每個人應該專注于核心能力,業務上哪塊最強就應該集中精力。網際網路時代最大的變化就是能夠快速共享很多資源,是以要從全方位什麼都幹到專注到某點共享外部資源。

最後是從産品發行的模式向場景化服務的模式轉換。傳統基金管理投資還是發個産品去賣去銷售,未來投資者更關注這個時候需要什麼,你就給我提供什麼服務。就像現在賣保險,不是像以前給你一個單子去填,你在哪裡買了機票,就來個延誤險,這個場景就要提供服務,而且是特定的服務。半個小時要登機了,敢不敢賣這個保險。阿裡巴巴的小額貸款,能夠實時給你貸款,就是因為有信用評估的能力,可以根據你的需要動态給你貸款。我們做投資,未來也是逐漸朝着這個方向發展。

這就是科學投資的了解,一個是理念,一個是資料,一個是平台。

最後的小結,投資科技給我們帶來的幫助無外乎三個方面,

一是幫助我們做資訊處理。

第二個幫助我們建構機器學習。

第三個可以共享知識和研究。

從科學投資來講未來有三個階段,大家可能可以預見:

第一個是提升工作效率,怎麼樣做到專業搜尋,讓你快速擷取想要的資訊。現在的資訊不是不夠,而是太多,這麼多的資訊裡面怎麼樣擷取精準需要的資訊,這就需要我們有專業垂直領域的搜尋幫助我們解決問題。我們需要借助機器幫我們處理資訊。

第二個是幫助我們建構知識圖譜和模型,真的讓資料驅動我們投資,這是具有挑戰的。一旦用資料驅動投資,建構這樣機器的時候,那就是智能投資的階段了。

最後我們有個願景,機器人基金經理,由機器人幫助我們完成投資全流程。

據雷鋒網此前報道,通聯資料(datayes)是萬向集團投資成立的一家金融資訊和投資管理服務公司,該公司希望通過大資料、雲計算、機器學習等資訊技術,為資産管理人提供新的金融資訊和投資研究資料分析服務。該公司旗下的蘿蔔投研,作為基本面研究平台,主要研究怎麼樣把基本面和量化分析架構結合起來。此外,也有線上量化研究平台,兩年前也研究了智能投顧,主要在于分析使用者行為,比對更加個性化的服務,而不是在市場上做短配置。

本文作者:溫曉桦

繼續閱讀