摘要: 以“數字金融新原力(The New Force of Digital Finance)”為主題,螞蟻金服ATEC城市峰會于2019年1月4日上海如期舉辦。财富管理專場上,螞蟻金服财富事業群資深技術專家康宇麟做了主題為《人工智能在财富領域的應用與探索》的精彩分享。
演講中,康宇麟分别從如何智能感覺使用者的需求,生産豐富的内容,動态的服務分發和提供更好的财富管理服務等四個方面為大家介紹了螞蟻金服在人工智能方面的一些探索與嘗試。在這四個方向上,螞蟻金服希望能夠與金融機構深度合作,通過螞蟻财富将金融機構的優質内容,優質服務和優質市場觀點接入到螞蟻系統,一起為使用者提供更好的服務。

以下内容根據演講嘉賓視訊分享以及PPT整理而成。
https://tech.antfin.com/activities/111/review/627
本次的分享主要圍繞以下兩大方面:
一、金融智能的核心能力
二、螞蟻金服AI中台
- 感覺使用者的需求
- 生産豐富的内容
- 動态的服務分發
- 更好的财富管理服務
人工智能技術這幾年非常火熱,螞蟻金服也在AI領域做了很多的探索,同時取得了一定的結果,沉澱了一定的能力。下圖中可以看到人工智能技術基本已深入到了螞蟻金服各個業務中。
智能營銷項目 。螞蟻金服經常會做一些營銷活動,給使用者發放權益紅包。以前的做法是發放固定價值的權益紅包。但有了智能營銷之後,可以根據使用者的特征,動态的決定給使用者發放紅包的價值。智能營銷大大的降低了螞蟻金服營銷活動的成本。
保險智能理賠 。使用人工智能技術可以幫助螞蟻金服決定給客戶理賠的金額,這大大提升了營運的效率。
網商風控大腦。人工智能幫助螞蟻金服根據借貸者的信用狀況,動态的決定給借貸者的借貸份額,在控制風險的前提下最大化利潤。
智能理财顧問。螞蟻金服正在開發一套系統,以人機互動對話形式為使用者提供一對一的個性化的理财顧問服務。
推薦陪伴服務。根據使用者的曆史的行為軌迹猜測出使用者的喜好。根據使用者的喜好動态的推薦适合使用者的服務,産品以及内容。
總體上,螞蟻金服主要在做以下兩件事,一是深度的洞察,二是實時決策。深度洞察是指多元度洞察,包括對投資者的洞察,對市場的洞察,對行業的洞察以及對産品的洞察等。了解了投資者和産品之後,在這個基礎上做實時決策。深度洞察和實時決策之間具有很強的依賴,通過高速的計算能力和智能決策平台友善螞蟻金服測試新的規則和政策。
螞蟻金服在人工智能領域的探索過程當中沉澱了強大的螞蟻金服中台。聚焦到螞蟻财富在人工智能方面的探索,主要做了如下四件事情。感覺使用者的需求,生産豐富的内容,動态的服務分發以及更好的财富管理服務。
1.感覺使用者的需求
智能問答系統。探索感覺使用者的需求有兩種方式。第一種是隐性方式,通過學習使用者的曆史行為軌迹,猜測使用者的需求。另外一種是顯性方式,使用者可以通過人機對話方式直接提問,問一些簡單的問題或者概念性的問題,比如說,什麼是基金?什麼是股票?或者更進一步,使用者也可以問現在有一萬塊錢,應該買什麼理财産品?或者可不可以推薦一個最适合使用者的基金?
下圖為螞蟻金服智能問答系統架構圖。當使用者提一個問題之後,主要經過五步。
Step1. 預處理。
a. 常用詞過濾。使用者在提問題的時候,會使用一些常用詞,而這些詞對後面分析使用者的意圖沒有任何幫助。使用者可能會說“早上好”,“麻煩問一下”。系統需要将這些常用詞在預處理階段直接過濾掉。
b. 糾錯。糾正使用者的拼寫錯誤。比如使用者經常會把“基金”寫成“機經”。
c. 實體識别。簡單來講,實體識别是對使用者輸入的句子進行分詞,再對每一個詞打上相應的标簽。使用者問“花呗如何開通?”,這句話裡面有三個詞,主語是花呗,問題是如何是操作,動詞是開通。對使用者的問題做實體識别會對後面具體識别使用者的意圖有很大的幫助。
Step2. 模型層。将使用者的問題轉化成事先定義好的意圖。比如說,使用者想查詢市場行情或者想購買基金,事先定義好這些意圖。如何把使用者問的問題轉化成意圖?分别通過規則和算法。規則方式一般使用FST模型和Fuzzy match(模糊比對)來提高覆寫率。規則模型最大的好處是一旦與使用者的意圖比對上了,準确率會非常高,但劣勢是覆寫率會很低。如果隻是依賴規則模型,很難了解使用者所有的問題。在規則模型基礎之上,螞蟻金服開發了基于算法的模型,如XG B, Fast Text,及RNN,和CNN等深度學習模型。算法類模型的好處是覆寫率比規則類模型高。是以通過将規則類和算法類模型結合在一起,便可以得到滿意的覆寫率和準确率。
Step3. 要素提取。使用者想在平台上購買一支基金,這是一個意圖,意圖中有三個要素。第一個是想買什麼基金,第二個是想什麼時候買,第三個是想購買的份額。使用者輸入了一個問題之後,系統如果判斷得出這個問題是一個購買基金的意圖,就會嘗試抓取抽取以上三個要素,如抽取到了三個要素,便可以直接幫助使用者下單。有時使用者可能隻告訴系統一個或兩個要素,其中有一些要素缺失,系統會反問使用者,直到使用者把所有要素資訊提供給系統,系統再幫助使用者下單。
Step4. 對話管理。對話管理主要做了兩件事情,意圖的切換以及将目前意圖中的要素進行存儲。假設使用者在之前的意圖中缺失要素,系統反問使用者收取要素資訊,使用者沒有回答這個問題,而問了另外的問題,即轉到了另外的意圖。這種情況下,系統會把目前意圖要素先進行存儲,等下一個意圖完成之後,使用者如果回到前一個意圖,系統再把之前的要素讀取出來,避免讓使用者進行重新輸入。
Step5. 排序和對話生成。Step3中提到的每個模型都會生成期望答案,在Step5中将它們的答案進行精排再做最後的決定。如下圖,使用者問基金分析,系統中比對到基金分析的意圖。從“基金分析”這個意圖中需要知道“基金名字”這個要素,由于使用者沒有告訴系統基金名字,是以反問“你想知看看哪個基金呢?”,使用者告訴系統是“中證白酒”,系統就可以提取“中證白酒”基金的相關資訊并傳回給使用者。之後使用者問了一句“有什麼新聞”,實際上這是另外一個意圖,但是因為在前一個意圖中使用者已經明确的告訴系統對“中證白酒”基金感興趣,是以系統傳回的新聞也是關于“中證白酒”的新聞。
2. 生産豐富的内容
單純了解使用者意圖還遠遠不夠,智能問答系統中需要有豐富的内容。對于内容的部分,螞蟻金服通過社群得到了優質的内容,以及通過爬蟲從網上抓取了更多資訊,再對資訊進行了處理加工。螞蟻金服本身并不是一家專業的内容生産公司,是以在内容方面更多的依賴于合作夥伴和機構。希望通過螞蟻财富,将機構的優秀内容接入到螞蟻系統中,再通過智能問答系統傳遞給使用者。網絡上有海量的資訊,最大的問題海量資訊都是以碎片化的方式很無序的散落在各個角落。這給使用者帶來了兩個問題,首先,他們不知道到從哪裡找到這些資訊。其次,因為這些資訊太過于零散,不知道如何發掘它們之間的關系,幫助使用者做更好的投資決策。螞蟻财富一直在嘗試克服海量資訊帶來的困難,從下圖可以看到螞蟻财富主要做的兩件事情。一是将無序的資訊變得有序,二是在有序資訊基礎之上,讓内容産生更多價值并服務于使用者。首先,散亂無序的内容片斷進入系統,系統通過各種各樣的嘗試将資訊變成有序的事件體系。對内容進行聚類和挖掘分析,最後提取出更有價值的資訊提供給客戶。
事件抽取。了解一個新聞或者一個事件有兩種範式,标準化事件通路和開放式事件通路。标準化事件通路,可以簡單的了解為類似的事情以前已經發生過或者見過,而且已經被系統梳理過,對這類事件和事件的要素進行定義。比如“上市公司高管離職”的事件中有三個要素,公司名字,高管姓名以及離職時間。如果事件已經遇到過,可以通過模闆定義事件,即使用深度學習的方法,将事件映射到一個标準的模闆,從模版中抽取要素。如果能夠抽取到事件要素,可以認為這個事件比對成功,即事件變成了結構化的資訊,而且系統知識圖譜庫對這個事件有一定了解。但有時會發生突發事件,如中美貿易戰就從未發生過,标準庫中并沒有這類事件的定義,可以通過開放式的事件通路來實作這類事件的抓取。開放式通路是将事件中的主謂賓抽取出來,把這些資訊存到知識圖譜庫中。假設“國民生產毛額明年會上升”事件以前沒有遇到,從這句話中把相關要素提取出來。主語是“國民生產毛額”,謂語是“上升”。如果後面發現類似事件出現的頻率很高,可以将開放式事件轉化成标準式事件。
事件推理
基于因果事件的定性影響推理。在事件抽取的基礎上做事件推理。一則新聞中提到“新能源車補貼有望十月出台,锂電池需求激增可期”。首先,從這句話中提取因果事件的單元對,了解到新能源車補貼出台會導緻锂電池的需求劇增。然後在知識圖譜庫裡查詢,發現锂電池需求激增對锂電池行業有利好。再從知識圖譜庫中找到锂電池行業龍頭股,即赢合科技和東源電器。從這件事情上可以推理出“新能源車補貼有望十月出台”是利好赢合科技和東源電器的。
基于統計回測的事件影響推理。有一則新聞說“2018年7月6日,上市公司高管李宏盛被抓”。首先從知識圖譜庫中尋找“李宏盛”,發現“李宏盛”是“登海種業”的高管,而登海種業的股票代碼為002041。通過規則可以知道這是一個上市公司高管不能履職的事件。根據這類事件進行回測,檢視這類事件曆史發生次數,發生之後股價在未來一個星期内的變化量,進行統計,推理出002041這支股票在未來一周之内會下降。
情感分析。情感分析實際上分兩類,篇章級和實體級。篇章級指的是給定一段文本,判斷這段文本情感上是正面還是負面。實體級情感分析是給定一段文本和句子,同時給定一個實體,判斷這段文本和句子對實體的影響是正面還是負面的。
篇章級的情感分析主要有兩條通路。基于情感覺識庫通路和基于機器算法通路。基于情感覺識庫通路可以了解為有一堆規則模闆,從文章中會抽取出若幹個情感單元,計算情感單元計情感分,最後彙集起來得到這篇文章的情感分。基于機器學習通路使用傳統的機器學習方法和深度學習方法,把文章直接映射到它的情感分,最後把兩條通路得到的情感分進行權重,一并輸出,作為整個篇章級的情感分。
實體級的情感分析也有兩條通路。第一條是直接确定,它依存文法分析,建立文法樹,通過事件要素提取,得到文章對實體是正面還是負面的影響。另外一條是通過機率相關方式,如采用啟發式方法,根據情感資訊與對象實體的距離,篇章結構關系等,得到所對應的情感分。使用者查詢基金501000,即中國平安,系統了解到中國平安最近發生了“平安好醫生申請IPO”事件,這個事件對中國平安是偏利好的事件,是以可以告訴使用者“平安好醫生申請IPO”事件對該基金的影響度是四星。
3. 服務分發
了解了使用者意圖和有了足夠的内容之後,現在可以回報使用者,即服務分發。服務分發解決三個問題,給使用者提供什麼樣的服務?怎麼給使用者提供這個服務?在什麼時候給使用者提供這個服務?這部分工作是基于比較成熟的算法,基本上整體過程是召回,幹預,召回和再幹預。如下圖,在使用螞蟻财富的APP時,資深投資人都在看系統推薦的内容,這部分内容和服務都是動态的,系統可以根據使用者的個人喜好,推薦的最适合的資訊和服務。
4. 智能投顧
資産配置
完成了感覺使用者意圖,生成豐富内容和服務分發之後,就和使用者建立了一定的信用關系,其中某些使用者已經購買了一些金融産品。螞蟻财富想更進一步結合金融工程與AI機器學習,完成優質資産組合,為客戶量身打造資産配置方案。資産配置方案第一步是進行資料彙集。其中有三類資料,一類來自市場上的公開資料,放在資産檔案中。另外一類是機構資料。螞蟻金服作為一個科技公司,一直信奉的觀點是讓專業人去做專業的事,螞蟻金服相信這些金融機構在金融領域的專業性和權威性。希望通過螞蟻财富号,将金融機構的觀點引入到螞蟻系統中,幫助螞蟻财富更加全面的對市場進行宏觀和微觀分析。最後一類是輿情觀點資料,即在内容生産階段拿到的關于輿情的資訊。通過資料彙總,對資料進行特征提取,包括衍生特征計算,時序特征歸納,和機構的觀點量化。假設機構觀點不可量化,在這一步首先要将機構的觀點進行量化。特征提取以後會得到超高維的特征集,由于超高維的特征集并不能夠直接被用來預測市場走勢,是以在下一步采取傳統的分析方法或者人工智能算法,對超高維的特征集做聚類,相關性分析和回歸分析,生成相應的因子,相應因子才是真正可以用來做市場預測。得到相關因子之後,配合常見的模型,如MPT,ML等,生成各種各樣的投資組合,它們适用于不同投資風格投資者。最後通過研究使用者的行為,采取比對算法,得到最适合使用者的投資組合。
點選閱讀更多,檢視更多詳情