天天看點

ChatGPT時代,很想問問AI這些金融難題何解?

作者:機器之心Pro

機器之心報道

作者:蛋醬

自從去年 ChatGPT 橫空出世,這款 AI 對話機器人俨然成為了全球最熱門的的技術話題。

「遇事不決,問 ChatGPT」成為了很多人面對選擇時高度信任的輔助決策方式,其中也包括尋求金融投資的建議。

近日,佛羅裡達大學的兩位學者公布了一項最新研究,他們将 ChatGPT 融合在投資模型中以預測股市的走勢,投資回報率能達到驚人的 500%。根據論文内容的介紹,模型首先會用 ChatGPT 深度分析上市公司釋出的新聞标題、内容确定是好消息還是壞消息,然後對這些内容進行評級,再通過複雜的計算公式制成「ChatGPT 指數」,結合公司的實時股價進行比對,以驗證 ChatGPT 的分析能力。

當然,面向變幻莫測的金融走勢,打造出「AI 巴菲特」并沒有那麼容易。就目前來說,像「ChatGPT 指數」這種新方法隻能作為決策過程中的一種參考。

不過,在金融投資領域,使用 AI 技術輔助決策确實是一個比較熱門的方向,并且衍生出了一個專門的名詞:量化交易。以基金趨勢模拟預測為例,AI 能夠對大量曆史業績等資料進行深入的分析,從中提取有用的特征,建構出具備高度泛化能力和市場動态适應能力的模型,進而在波動的市場條件下持續保持良好的預測表現。

量化模型需要具備對金融場景的深度了解能力,進行投資者情感分析和市場情緒預測,而這顯然是 ChatGPT 所擅長的。半年來,在 ChatGPT 類産品的啟發和推動下,量化交易和 AI 技術之間的火花進一步迸發。

與此同時,我們更關心的是,這場 ChatGPT 風暴又将如何從全局角度推動 AI 技術在金融領域的落地?

金融智能,走到哪一步了?

近年來,AI 技術在金融領域的運用正在不斷加深,為金融行業的風控、營銷、投顧、管理等業務注入了數字化的血液,為銀行、保險、基金、券商等金融機構實作數智化轉型提供了引擎動能。

從行業研判、投顧服務、保險理賠、到信貸風控,這些我們熟知的金融業務場景,背後都有機器學習、計算機視覺、自然語言處理等多項技術作為支撐。每一個應用場景衍生出的挑戰是不同的,涉及到的技術方向也不盡相同。這些年,AI 技術也在持續演進,小樣本學習、可信 AI、可解釋 AI、AIGC 等新工具陸續湧現,尤其去年底,大模型技術徹底改變了人工智能技術的前沿圖景,大模型能說會道的語言能力、壓縮大量領域常識的知識能力,對數字化專業工具的推理排程能力無疑在金融行業裡有廣闊的應用空間,給我們帶來挑戰的同時,也打開了創新的可能空間。

那麼,這些人工智能的新技術、新方法會在金融領域有何創新應用?此處,我們可以選擇「金融資料驗真」、「金融資料了解」、「金融場景了解」三個方向來談談最近的變化。

首先談談「金融資料驗真」。數字金融業務的本質是基于資料和資訊流轉的價值交換,這些資料和資訊的真實性和可靠性是以構成數字金融業務能否順利進行的關鍵。例如,在數字支付場景下,使用者支付憑證的真實性和可驗證性直接關系到支付的安全和效率;在數字借貸場景下,借款人提供的個人借貸資料的真實性和可驗證性則是判斷其還款能力和風險等級的基礎。

是以,在各類數字金融交易中,各類憑證和文檔的驗真手段是必不可少的,以保證其真實性和可靠性。特别是對非标文檔篡改檢測的探索,一直是工業界和學術界的重要研究方向。

金融文檔中的文本包含大量重要和敏感資訊,句子中的任何一個小改動都可能扭曲其承載的整體語義。随着 NLP 文本處理技術的發展,黑灰産業在欺詐、營銷或其他非法活動中,利用計算機進行的虛假資訊篡改愈演愈烈,是以,預防文檔中的文本被篡改是至關重要的。

此前,圖像篡改檢測的技術研究對象集中于自然場景圖像,大多依賴于物體邊緣或表面相對明顯的視覺篡改線索,而在文檔中幾乎不存在這種線索。原因如下:

一是文檔圖像中的文本篡改方法相當多樣:有的是拼接,即從一個圖像中複制區域并粘貼到其他圖像上;有的是複制 - 移動,即改變圖像中物體的空間位置;還有的是生成,即用視覺上合理但不同的内容替換圖像中的區域。

二是篡改文本相比場景圖像來說更加隐蔽。被篡改的文本區域可能非常小,比如一個段落中的一個字元;而且被篡改的區域和周圍環境之間的對比度可能非常低,文檔的圖像大多具有相同的背景顔色,且文本通常具有相同的字型和大小。

相對來說,文本篡改檢測方法的發展卻還不夠成熟。目前業界有一些是針對類如身份證、營業執照等結構化文檔的算法工作,對于金融領域常見的各類資質證書、合同、報告等非結構化的文檔篡改,傳統的檢測系統往往難以進行判定及修改内容定位。

針對文檔圖像篡改的檢測難題,學術界提出了各種方法。有研究者引入圖神經網絡(GNN),在圖注意力機制的幫助下檢測文檔圖像中的篡改區域,但這種方法隻對比較清晰、整潔的檔案有良好的效果,比如如掃描檔案。也有研究者使用雙流 Faster-RCNN 網絡,對圖像進行端到端的訓練以檢測給定的篡改圖像區域,然而這種類型的篡改線索大多存在于生成性篡改中,卻很難在非常小的複制粘貼篡改中被找到。

在上述方法的啟發下,文檔篡改檢測确實取得了很大進展。不過現有方法在遇到各種文檔的複雜場景時,仍缺乏足夠的魯棒性和跨領域的泛化能力,還需進一步探索。

第二個值得關注的方向是「金融資料了解」。在理财、信貸、保險等現實金融業務場景中,提供金融業務服務的主體不僅要了解使用者提供的多種模态資料,比如信貸自證材料資料、寵物險的寵物圖檔等,同時也需要結合領域結構化、非結構的資料生産出專業、可控的理财、保險、行研知識來解答使用者的問題,為使用者提供全流程數字化的金融服務。這一領域涉及的技術是衆多的,計算機視覺、自然語言處理與生成、AIGC 等等。

從了解層面看,金融場景非結構化資料占比高,且種類多樣,形态多樣,異構性明顯,比如信貸場景使用者自證資料,行業認知研究的行業研報、公司财報,以及保險條款等等,多樣性的文檔結構、差異化的上下文語義環境帶來對非結構化文檔的知識結構化任務的挑戰。同時,金融場景文檔的專業性還導緻了标注成本高、單一場景的樣本量不足等問題。

從生成層面看,随着金融科技的不斷發展和應用,金融服務的專業度日益提高,對于内容生産的專業性和合規性也提出了更高的要求。一項特别的挑戰在于,專業的知識和金融邏輯是金融領域内容生産的核心要求。但這恰恰對目前流行的 ChatGPT 型大模型構成較大挑戰,大模型産出的内容要在金融領域真正應用,需要確定輸出内容合規(符合監管要求)、專業(符合金融邏輯),嚴謹(不出現知識幻覺等事實性錯誤)。金融内容的智能生産,需要大模型的可信可控,能以合規、專業、嚴謹的标準對外輸出。

此外,基于「金融場景了解」的技術應用命題也非常受到關注。AI 技術的革新,同樣為這一方向的落地帶來了加速度。就比如上文提到的「量化交易」,無論一位投資者采取什麼樣的投資政策,金融市場的波動都是可以依靠統計方法和程式設計預期的,專業的投資者往往會嘗試預估自身的整體回報。此前已有許多基于計算機的算法和模型用于金融市場交易,時序資訊提取、圖學習、模型內建等機器學習技術在該類任務中均展現了巨大的應用價值。

從原理上說,「市場價格的波動受到理性和人類行為的共同影響」一引自《阿爾法經濟學》,投資者不可避免地要對新聞資訊做出自己的判斷和響應。比如,一位投資者發現蘋果公司的股票價格會在出貨量飙升之後出現大幅波動,如果想探尋其中的規律,投資者就可以建構一個模型,在蘋果公司在股票市場的走勢曆史資料中尋找這種模式,并根據規律去決策。

通常來說,從越多的新聞中擷取有效的事件表征,量化模型就越能輔助投資者采取更合理的決策。近年來,一些研究開始應用自然語言處理(NLP)技術來學習新聞事件的神經網絡表征并基于此建構事件驅動的交易政策。

從去年開始,以 ChatGPT 為代表的大模型産品也成為了投資者寄予厚望的對象。大模型可以處理大量異構資料,如股票交易資料、宏觀經濟資料、公司财務報告等,同時還可以處理非結構化資料,如新聞報道、社交媒體資訊等,全面提高預測結果的準确性。

國内首套綜合類金融科技榜單釋出

面向這些金融智能領域的前沿技術命題,不管是學界還是業界,都抱有濃厚的探索興趣,以往也有很多賽事和榜單圍繞此類命題展開,并收獲了廣泛關注。

為了推動金融智能領域的潛力發掘,在 CCF 指導下,6 月 19 日,螞蟻集團旗下的螞蟻财富、螞蟻保和網商銀行公布了國内首套金融科技榜單(算法競技比賽) AFAC2023 金融智能挑戰賽,浙江大學、上海交通大學、西安交通大學、中央财經大學、螞蟻技術研究院和天池平台聯合發起和舉辦。

大賽官網:https://tianchi.aliyun.com/specials/promotion/AntFinTechAIChallenge

值得注意的是,這是國内第一份從解決應用問題出發的綜合金融科技榜單,填補了市場的空白。

螞蟻集團副總裁、螞蟻集團财富保險事業群 CTO、螞蟻金融技術委員會主席王曉航表示:「作為一家金融科技公司,螞蟻希望通過這場大賽,鼓勵參賽者從行業最前沿、最有挑戰性的具體問題着手,探索各種創新的模型和算法,為關注金融科技的年輕人提供一個平台,共同探讨人工智能技術在金融領域的創新前景。」

三大核心方向,六大賽題

結合自身營運經驗,螞蟻圍繞國内金融場景應用中的核心技術命題,設定了三大核心方向的六個子賽題:

ChatGPT時代,很想問問AI這些金融難題何解?
ChatGPT時代,很想問問AI這些金融難題何解?
ChatGPT時代,很想問問AI這些金融難題何解?

榜單涵蓋通用機器學習、計算機視覺、自然語言處理等多個算法領域,面向全球開放,高等院校、科研機關、網際網路企業等人員均可報名參賽。

該項賽事請到了清華大學計算機系教授唐傑作為大賽主席,以及來自北京大學、上海交通大學、浙江大學、複旦大學、中國人民大學、西安交通大學、中山大學、天津大學、中央财經大學和華東師範大學等高校的數十位教授組成專家評審委員會。通過線上排行榜自動評測與院校教授、行業專家評審結合的方式選拔優秀技術人才或團隊。

賽程安排

目前,隻需登入比賽平台官網,完成個人資訊注冊,即可報名參賽。

感興趣的選手可單人成隊或最多不超過 3 人組隊參賽,每位選手隻能加入一支隊伍,每隊可選多個賽題參賽。

報名認證:2023 年 6 月 19 日 - 7 月 31 日,UTC+8

比賽時間:2023 年 6 月 19 日 - 8 月 4 日,UTC+8

最終,成績排名前 6 名的隊伍需送出比賽代碼與技術報告:

報告送出:2023 年 8 月 11 日,UTC+8

這場比賽将在 8 月底和 9 月完成線下評審和頒獎。奪取冠軍的團隊将獲得 5 萬元人民币的獎金,亞軍獎金為 2 萬元人民币,季軍獎金為 1 萬元人民币,此外還将享受以下福利:

1. 綠色通道:優秀選手有機會獲得 Offer 綠色通道,入職螞蟻金融技術團隊。

2. 榮譽證書:獲獎選手均獲得大賽榮譽證書。

3. 線下頒獎:獲獎選手将受邀參加在上海舉辦的頒獎典禮,與學界、行業大咖面對面交流。

ChatGPT時代,很想問問AI這些金融難題何解?

對了,在報名階段,推薦小夥伴參賽成功的選手還有機會獲得大賽禮品~

ChatGPT時代,很想問問AI這些金融難題何解?

想了解更多比賽細節?歡迎報名參賽~

報名連結:https://tianchi.aliyun.com/specials/promotion/AntFinTechAIChallenge

繼續閱讀