天天看點

大模型+資料分析,改變人類使用資料的習慣

作者:資料猿
大模型+資料分析,改變人類使用資料的習慣

“小李,幫我分析一下我們的貸款業務增長趨勢如何?哪個分支行的表現最好?新開設的線上理财産品的銷售額是多少?馬上給我一個分析報告”,某大型銀行的副總經理王先生,對李經理提出了這樣的資料分析需求。為了完成這個任務,李經理需要從銀行的資料平台中擷取和分析資料,以回答上司的問題。然而,這可能涉及到一些複雜的資料操作,如連接配接不同的資料源(例如貸款資料庫和理财産品資料庫)、過濾和聚合資料、建立資料可視化圖表等。

以上,隻是一個業務人員進行資料分析的模拟場景。事實上,随着各行各業數字化轉型更新的持續推進,類似的資料分析場景已經遍布各個領域。随着資料驅動決策在全球範圍内的廣泛應用,資料分析的價值日益凸顯。然而,傳統的資料分析方法往往需要深厚的技術知識和專業技能,這在一定程度上限制了其在更廣泛的場景中的應用。随着科技的發展,資料分析的互動方式也在不斷演進。從早期的程式設計語言和SQL查詢,到拖拉拽的資料分析工具,我們可以看到一種明顯的趨勢,那就是讓資料分析變得更加直覺和易用。那麼,我們能否更進一步呢?

在7月14日舉辦的2023 Kyligence “釋放數智生産力”使用者大會上,筆者見證了一種全新的可能——基于大模型的自然語言互動方式,來實作資料分析。接下來,我們将探讨資料分析方式的演進邏輯,分析Kyligence如何将名額平台、資料分析與大模型融合,實作基于自然語言的名額資料分析,為資料分析的未來描繪一幅可能的藍圖。

更自然的人機互動,是永恒的追求

資料分析互動方式的演進,可以視作是一場尋求更佳人機互動方式、降低分析門檻的持久探索。從早期的程式設計語言和SQL查詢,到拖拉拽的資料分析工具,再到基于大模型的自然語言互動方式,我們不斷在推進資料分析的普及化和易用性。

早期,資料分析主要依賴于程式設計語言,比如Python、R等。這類語言通常包含專門用于資料分析的庫和工具,如Python的Pandas、NumPy、SciPy等,使得程式員可以通過編寫代碼來處理和分析資料。然而,這類方式的明顯短闆在于門檻較高。一方面,使用者需要掌握程式設計知識,包括文法、資料結構和算法等;另一方面,還需了解專門的資料處理庫和工具。這樣的要求使得非技術背景的使用者難以應對。

随着SQL的誕生和流行,資料查詢與處理的門檻降低了一些。SQL為結構化的資料提供了一種更為高效和直覺的查詢方式,其語句近似自然語言,比如“SELECT * FROM table WHERE condition”,直覺且易學。然而,SQL仍然需要使用者掌握一定的文法知識,而且對于複雜的查詢和分析任務,SQL的語句可能會變得冗長且難以了解。此外,SQL主要用于結構化資料,對于非結構化資料,其處理能力有限。

為了進一步降低使用門檻,一種新型的資料分析工具應運而生,即所謂的拖拉拽式資料分析工具,如Tableau、PowerBI等。這些工具通過可視化的界面,讓使用者可以直覺地選擇和操作資料,建立資料可視化圖表。這種方式相比程式設計語言和SQL,大大降低了資料分析的門檻,使得非技術使用者也能夠進行資料分析。

然而,拖拉拽的資料分析互動方式在易用性方面還存在一些問題,主要表現在以下三個方面:

首先,盡管拖拉拽工具相對直覺,但使用者仍需要花費時間學習如何使用它們。例如,使用者需要知道如何添加和删除資料源、如何選擇正确的圖表類型、如何應用和了解不同的資料操作(如篩選、排序、聚合等)。這些功能和概念,尤其是一些進階的資料操作和分析功能,對于沒有資料分析背景的使用者來說,可能仍然需要一段時間去了解和掌握。

其次,拖拉拽工具的操作可能會變得相當複雜,特别是對于一些進階的資料操作和分析任務。例如,使用者可能需要通過多次拖拉拽和選擇操作,才能建立一個複雜的資料儀表闆或執行一次複雜的資料分析。對于一些更複雜的需求,例如需要聯結多個資料源或需要進行複雜的資料預處理,拖拉拽工具可能無法滿足,或者操作起來非常複雜和困難。

最後,盡管拖拉拽工具通常提供了豐富的資料操作和可視化功能,但使用者仍需要對資料和資料分析有一定的了解,才能有效地使用這些工具。例如,使用者需要知道哪些資料是相關的,哪些資料是可以比較的,哪種圖表可以有效地表達某種資料關系等。如果使用者對資料分析的基本概念和方法沒有足夠的了解,他們可能會感到困惑,不知道如何選擇和使用這些功能。

是以,拖拉拽的資料分析方式,門檻還是不夠低,互動方式還是不夠自然。那麼什麼才是最自然的人機互動方式呢?回想一下,人類平時是用什麼交流的?——自然語言。既然人與人之間可以用自然語言交流,那為什麼不能用自然語言來進行人機“交流”呢?如果能夠實作基于自然語言的資料分析互動,那在易用性上必然會更進一步。

Kyligence就是按照這個思路,來變革資料分析互動體驗的。

基于大模型,建構基于自然語言的資料分析方式

依據Kyligence的實踐經驗,要做好這個事情,關鍵的有三個方面:基于大語言模型來準确了解使用者資料分析需求;聯通名額平台來進行資料計算和分析,給出分析結果;打通各個SaaS系統,以分析結果推動業務流程改善,提升管理與經營效率,實作組織協同。

首先,基于大語言模型來準确了解使用者資料分析需求。大語言模型如ChatGPT,通過訓練大量的文本資料,它們可以了解和生成自然語言,使得人機互動更加自然、便捷。在資料分析場景下,使用者可以用自然語言描述他們的資料需求,例如“我想知道上個季度的銷售額”或者“請告訴我我們最暢銷的産品是什麼”。大語言模型可以解析這些需求,轉化為可以執行的資料查詢和分析任務。這大大降低了資料分析的門檻,讓非技術使用者也可以輕松地進行資料分析。

其次,聯通名額平台進行資料計算和分析。名額平台是一個專門為資料分析設計的系統,它可以處理各種資料,包括結構化和非結構化資料,進行複雜的資料計算和分析。在了解使用者需求後,我們需要依賴名額平台來執行具體的資料操作,例如資料查詢、篩選、排序、聚合等,并生成分析結果。這一步是資料分析的核心環節,它決定了資料分析的品質和效率。

最後,打通各個SaaS系統,以分析結果推動業務流程改善。資料分析的目标不僅僅是擷取資料洞察,更重要的是,根據這些洞察來改善業務流程,提升管理與經營效率。是以,我們需要将資料分析結果回報到各個業務系統中,例如CRM、ERP等,以支援業務決策和操作。例如,如果我們發現某個産品的銷售額下降,我們可以通過CRM系統調整銷售政策;如果我們發現某個供應商的供貨速度太慢,我們可以通過ERP系統調整采購計劃。這樣,我們可以實作資料驅動的業務流程改善,提升整個組織的營運效率。

需要指出的是,Kyligence并不是推出了一個“PPT産品”,而是可供客戶使用的商用版本。接下來,我們就以Kyligence Copilot這一産品,來看看基于自然語言的資料分析互動方式到底是怎樣一種體驗。

據了解,Kyligence Copilot AI 數智助理是基于 Kyligence Zen 一站式名額平台的 AI 數智助理,結合大語言模型能力,幫助使用者通過自然語言對話完成圍繞業務名額的分析和洞察,大幅降低業務人員用數的門檻、提升工作效率。

從上面的示範我們可以看到,使用者可以直接問Kyligence Copilot“公司最近利潤情況如何?”,系統會推薦淨利潤、淨利潤月環比、淨利潤月累計等名額,使用者標明之後,Kyligence Copilot會給出分析結果。在此基礎上,Kyligence Copilot基于資料給出結論和建議,比如哪一個月利潤高、哪一個月利潤低,淨利潤的整體趨勢是怎樣的。

進一步的,Kyligence Copilot還會對更深入的資料分析給出建議,比如“可以進一步分析各個地區、商品類别的淨利潤情況,找出優勢區域和商品,進一步優化經營政策”,使用者可以依據建議一步步進行更深入的資料探索。最終,可以把這些所有的資料分析生成儀表盤,來直覺的展現資料分析結果。

大模型+資料分析,改變人類使用資料的習慣

對于企業管理者而言,資料分析隻是手段,目的是通過資料分析找到業務上的問題,進而通過優化管理和業務流程,來提升經營效率。因而,在Kyligence Copilot的資料分析基礎上,作出管理和業務決策,并将這些決策通過打通飛書、釘釘、企業微信等系統,嵌入到整個組織的管理和業務流程中,讓資料分析的結果回報到經營管理體系當中。

這是一條剛剛開始的征途

需要指出的是,盡管基于大模型的自然語言互動方式在了解使用者資料分析需求方面已經展現出了強大的潛力,但變革才剛剛開始,我們還需要努力解決一些挑戰,不斷提升能力和使用者體驗。

例如,需要優化大模型與名額平台、資料分析平台的對接方式。大模型了解并生成的是自然語言,而名額平台通常接受的是具體的資料查詢和操作指令。我們需要一個轉換器,将大模型的輸出轉化為名額平台可以了解和執行的指令。這可能涉及到一些技術難題,如自然語言到SQL的轉換,以及如何将複雜的資料分析需求分解為一系列可以執行的資料操作。

此外,大模型的準确性和穩定性也是一大挑戰。雖然大模型可以了解和生成自然語言,但是在一些複雜和模糊的場景下,它的了解可能并不準确,或者産生的結果可能有多種可能。我們需要提供足夠的回報機制,以及在必要時提供人工幹預,確定資料分析的結果準确和可靠。而且,資料分析通常涉及到大量的敏感資料,如使用者資訊、交易資料等,我們需要確定大模型在處理這些資料時,可以充分保護資料的安全和使用者的隐私。

當然,雖然還存在一些挑戰,但這條路有異常廣闊的應用前景。将大模型與名額平台和資料分析平台融合,實作以自然語言進行資料分析,是資料科技領域的一次重大創新,它将深刻改變資料分析的面貌,推動各行業的數字化轉型,帶來廣泛而深遠的影響。

對于個人而言,将大大降低資料分析門檻,提升分析效率。傳統的資料分析需要學習和了解複雜的查詢語言和工具,而基于自然語言的資料分析隻需要使用者用他們熟悉的語言描述他們的需求。這意味着任何人,無論他們的技術背景如何,都可以進行資料分析,實作真正的普惠資料分析。其次,這将顯著提高資料分析的效率和效果。傳統的資料分析往往需要大量的資料操作和計算,而基于自然語言的資料分析可以直接從使用者需求出發,自動進行資料查詢和分析,提供直接的資料洞察。這使得資料分析更加快速和準确,更能滿足使用者的實際需求。

對于企業而言,将加快決策速度和精準度,提升經營管理效率和業務創新能力。自然語言的互動方式,大大加快資料分析的速度,使得決策者可以更快地得到資料洞察,更快地做出決策。而且,基于大模型的自然語言了解,可以處理複雜的資料分析需求,如比較分析、因果分析、預測分析等。這将大大增強資料分析的深度和精度,使得決策者可以得到更深入、更準确的資料洞察,做出更好的決策。管理者不僅可以快速擷取業務洞察,還可以根據洞察調整業務流程,甚至是與其他SaaS系統的內建,這将極大地提高企業的業務效率和營運效率。資料分析是數字化轉型的關鍵環節,它可以幫助企業了解和利用他們的資料,創新産品和服務。

對于社會而言,将推動社會數字化轉型。基于自然語言的資料分析,可以讓更多的企業和個人參與到資料分析中來,進一步推動各行業的數字化轉型。資料分析可以幫助我們了解和解決各種社會問題,如公共衛生、環境保護、教育公平等。基于自然語言的資料分析,可以讓更多的人參與到這些工作中來,共同推動社會的進步。可以預見,随着資料分析的普及和深入,社會将有更多的機會發現新的業務模式、新的市場機會、新的社會需求。

想象一下,當這種資料分析方式大規模推廣後,我們将會看到一個全新的資料分析生态。在這個生态中,任何人都可以輕松地進行資料分析,找到他們需要的答案和洞察。各行各業都可以充分利用他們的資料,優化業務,提高效率,創新産品。我們的社會也會是以變得更加公正、更加高效、更加創新。這将是一個美好的未來,值得我們共同期待和努力。

文:月滿西樓 / 資料猿

繼續閱讀