本節書摘來自華章社群《大資料導論》一書中的第1章,第1.5節案例學習,作者瓦吉德·哈塔克(wajid khattak),保羅·布勒(paul buhler),更多章節内容可以通路雲栖社群“華章社群”公衆号檢視
1.5 案例學習
雖然eti公司目前的政策選擇了大資料技術作為實作它們戰略目标的手段,但eti并沒有大資料技術,是以需要在雇傭大資料咨詢團隊還是讓自己的it團隊進行大資料訓練中進行選擇。最終它們選擇了後者。然而,隻有進階的成員接受了完整的學習,并且轉換為公司永久的大資料咨詢員工,同時由他們去訓練初級團隊,在公司内部進行進一步大資料訓練。
接受了大資料學習之後,受訓小組的成員強調他們需要一個常用的術語詞典,這樣整個小組在讨論大資料内容時才能處于同一個頻道。其後,他們選擇了一個案例驅動的方案。當讨論資料集的時候,小組成員将會指出一些相關的資料集,這些資料集包括理賠、政策、報價、消費者檔案、普查檔案。雖然這些資料分析和分析學概念很快被接受了,但是一些缺乏商務經驗的小組成員在了解bi和建立合适的kpi上依舊有困難。一個接受過訓練的it團隊成員以生成月報的過程為例來解釋bi。這個過程需要将作業系統中的資料輸入到edw中,并生成諸如保險銷售、理賠送出處理的kpi在不同的儀表闆和計分闆上。
就分析方法而言,eti同時使用描述性分析和診斷性分析。描述性分析包括通過政策管理系統決定每天賣的保險份數,通過理賠管理系統統計每天的理賠送出數,通過賬單系統統計客戶的欠款數量。診斷性分析作為bi活動的一部分,例如回答為什麼上個月的銷售目标沒有達成這類問題。分析将銷售劃分為不同的類型和不同的地區,以便發現哪些地區的哪些類型的銷售表現得不盡人意。
目前eti并沒有使用預測性分析和規範性分析手法。然而,對大資料技術的實行将會使他們最終能夠使用這些分析手法,正如他們現在能夠處理非結構化資料,讓其跟結構化資料一同為分析手法提供支援一樣。eti決定循序漸進地開始使用這兩種分析方法,首先應用預測性分析,鍛煉了熟練使用該分析的能力後再開始實施規範性分析。
在這個階段,eti計劃利用預測性分析來支援他們實作目标。舉個例子,預測性分析能夠通過預測可能的欺詐理賠來檢測理賠欺詐行為,或者通過對客戶流失的案例分析,來找到可能流失的客戶。在未來的一段時間内,通過規範性分析,我們可以确定eti能夠更加接近他們的目标。例如,規範性分析能夠幫助他們在考慮所有可能的風險因素下确立正确的保險費,也能幫助他們在諸如洪水和龍卷風的自然災害下減少損失。