天天看點

四種大資料分析方法與大家分享

四種大資料分析方法與大家分享

本文主要講述資料挖掘分析領域中,最常用的四種資料分析方法:描述型分析、診斷型分析、預測型分析和指令型分析。

當剛涉足資料挖掘分析領域的分析師被問及,資料挖掘分析人員最重要的能力是什麼時,他們給出了五花八門的答案。

其實我想告訴他們的是,資料挖掘分析領域最重要的能力是:能夠将資料轉化為非專業人士也能夠清楚了解的有意義的見解。

使用一些工具來幫助大家更好的了解資料分析在挖掘資料價值方面的重要性,是十分有必要的。其中的一個工具,叫做四維分析法。

簡單地來說,分析可被劃分為4種關鍵方法。

下面會詳細介紹這四種方法。

1. 描述型分析:發生了什麼?

這是最常見的分析方法。在業務中,這種方法向資料分析師提供了重要名額和業務的衡量方法。

例如,每月的營收和損失賬單。資料分析師可以通過這些賬單,擷取大量的客戶資料。了解客戶的地理資訊,就是“描述型分析”方法之一。利用可視化工具,能夠有效的增強描述型分析所提供的資訊。

如下圖中的“各産品銷售量統計表預警圖”,從圖中可以明确的看到哪些商品的銷售達到了銷售量預期。

四種大資料分析方法與大家分享

2. 診斷型分析:為什麼會發生?

描述性資料分析的下一步就是診斷型資料分析。通過評估描述型資料,診斷分析工具能夠讓資料分析師深入地分析資料,鑽取到資料的核心。

良好設計的BI dashboard能夠整合:按照時間序列進行資料讀入、特征過濾和鑽取資料等功能,以便更好的分析資料。

如下圖中的“銷售控制台”,從圖中可以分析出“區域銷售構成”、“客戶分布情況”、“産品類别構成”和“預算完成情況”等資訊。

四種大資料分析方法與大家分享

3. 預測型分析:可能發生什麼?

預測型分析主要用于進行預測。事件未來發生的可能性、預測一個可量化的值,或者是預估事情發生的時間點,這些都可以通過預測模型來完成。

預測模型通常會使用各種可變資料來實作預測。資料成員的多樣化與預測結果密切相關。

在充滿不确定性的環境下,預測能夠幫助做出更好的決定。預測模型也是很多領域正在使用的重要方法。

如下圖中的“銷售額和銷售量”,可以分析出全面的銷售量和銷售額基本呈上升趨勢,借此可推斷明年的基本銷售趨勢。

四種大資料分析方法與大家分享

4. 指令型分析:需要做什麼?

資料價值和複雜度分析的下一步就是指令型分析。指令模型基于對“發生了什麼”、“為什麼會發生”和“可能發生什麼”的分析,來幫助使用者決定應該采取什麼措施。通常情況下,指令型分析不是單獨使用的方法,而是前面的所有方法都完成之後,最後需要完成的分析方法。

例如,交通規劃分析考量了每條路線的距離、每條線路的行駛速度、以及目前的交通管制等方面因素,來幫助選擇最好的回家路線。

結論

最後需要說明,每一種分析方法都對業務分析具有很大的幫助,同時也應用在資料分析的各個方面。

對大資料以及人工智能概念都是模糊不清的,該按照什麼線路去學習,學完往哪方面發展,想深入了解,想學習的同學歡迎加入大資料學習qq群:458345782,有大量幹貨(零基礎以及進階的經典實戰)分享給大家,并且有清華大學畢業的資深大資料講師給大家免費授課,給大家分享目前國内最完整的大資料高端實戰實用學習流程體系 。從java和linux入手,其後逐漸的深入到HADOOP-hive-oozie-web-flume-python-hbase-kafka-scala-SPARK等相關知識一一分享!

繼續閱讀