天天看點

教授觀點丨張曉燕:金融領域正迎來大語言模型的巨大機遇

作者:清華五道口
教授觀點丨張曉燕:金融領域正迎來大語言模型的巨大機遇

9月26日,2023中國普惠金融國際論壇暨數字經濟開放研究平台學術峰會在北京召開,清華大學五道口金融學院副院長、金融學講席教授張曉燕受邀參加,并發表了“人工智能在金融領域的應用與挑戰——以大語言模型為例”的主題演講。演講中,張曉燕認為大語言模型在自然語言處理領域已經表現出令人驚喜的技術突破,大語言模型在資料分析和決策支援等方面的出衆能力将促進全球生産效率的提升。她還結合案例總結了大語言模型在金融領域的應用與挑戰。

教授觀點丨張曉燕:金融領域正迎來大語言模型的巨大機遇

圖為張曉燕作主題演講

大語言模型是一種用于處理自然語言資訊的大型人工智能模型。大語言模型在大規模文本資料上進行訓練,學習語言中的文法、語義和上下文資訊,使它們能夠了解和生成人類語言并執行多種任務,主要應用場景有知識問答、情感分析、本文生成、知識抽取、摘要總結等。模型參數量大是大語言模型的顯著特點,國際上Open AI的GPT3.5模型參數量達到1750億,而GPT4預計其參數量達到1萬億;國内上海AI實驗室的書生·浦語(InternLM)閉源版本有1040億參數,是在包含1.8萬億 token 的語料上訓練而成。大語言模型的大參數特點帶來了各項能力的突破,Zhong et al.(2023)研究表明大語言模型在很多考試方面的能力已經接近并超過人類水準。這些考試包括美國高中畢業生學術能力水準考試(SAT)、美國研究所學生入學考試(GRE)、聯考(China College Entrance Exam)、律師資格考試和國家公務員考試。

教授觀點丨張曉燕:金融領域正迎來大語言模型的巨大機遇

圖為論壇現場

張曉燕表示,大語言模型技術帶來了全球經濟生産效率的提升。第一,2023年麥肯錫釋出的一份調查問卷表明,大語言模型已經被很多行業應用,提高行業效率。所有行業中,金融服務業和科技行業的受訪者使用生成式AI的頻率最多;企業不同的部門中,市場營銷、客服管理、研發和軟體開發的受訪者使用生成式AI的頻率最多。第二,大語言模型将助力經濟增長,其在各行業的廣泛應用将帶來全社會生産效率的提高。第三,大語言模型推動就業市場更疊,它能夠替代部分簡單文本處理職位,同時也将提供全新的就業崗位。國家對于大語言模型等人工智能技術保持積極鼓勵的态度,行業處于市場有序發展、監管不斷完善的新局面。

張曉燕認為,大語言模型對于金融行業産生的潛在影響可能更大。大語言模型在投資場景中可用于投資決策、風險評估、市場分析、文檔處理、自動化客戶服務和輿情分析等。比如,在宏觀經濟分析中,可以基于大語言模型來分析美國央行對于貨币政策的态度。在銀行理财業務中,生成式AI的應用場景貫穿銀行全産業鍊的各環節。相比于其他行業,金融行業需要處理包括新聞、分析師研究報告政府政策等多種資訊,大語言模型可以更便捷地提取和分析海量文本。其次,金融資訊的時效性需要分析師快速做出決策,大型語言模型可以在秒級内分析市場并提出建議。此外,大量的金融服務都需要語言溝通,未來大語言模型可能可以回答客戶查詢,提供投資建議,甚至部分替代人工客服和投資顧問。

在快速發展的同時,大語言模型應用于金融領域也面臨一些技術挑戰。一是金融專業領域知識的匮乏性(即大語言模型在金融領域語料不足);二是大語言模型訓練的成本問題,訓練大語言模型所需算力的成本高昂;三是金融資訊有及時性需求,大語言模型的訓練語料可能存在滞後性問題;四是金融決策的精确性要求;五是金融領域的高動态性問題,例如金融領域的專業詞彙在動态增加,同樣的術語在不同時間可能含義有所變化。

一些解決方案可以應對目前的難題。一是重新基于金融語料預訓練金融領域大語言模型;二是基于某個開源大語言模型,通過不同的微調技術,将大語言模型的能力與人類的需求對齊,再打造一個符合特定場景的金融大語言模型;三是結合詞向量資料庫與Langchain技術,通過及時更新詞向量資料庫,來讓大語言模型擁有最新的準确資訊。

最後,張曉燕進行了總結和展望,她認為大語言模型雖然出現的時間較短,但是正在對全球和中國經濟産生積極的影響,金融行業的衆多業務場景非常适合大語言模型的應用和落地。在未來,應用金融行業大語言模型落地同樣面臨諸多挑戰,為了規範大語言模型在金融領域健康有序的發展,相關監管部門需要及時制定規章制度,指引行業健康發展。

教授觀點丨張曉燕:金融領域正迎來大語言模型的巨大機遇
教授觀點丨張曉燕:金融領域正迎來大語言模型的巨大機遇

繼續閱讀