天天看點

資料分析架構整理--基于《誰說菜鳥不會資料分析——入門篇》

一、資料分析概述

資料分析的類别

  • 描述行資料分析
  • 探索性資料分析
  • 驗證性資料分析

資料分析的作用

  • 現狀分析
    • 了解企業營運情況及構成
  • 原因分析
    • 确定業務變動的具體原因
  • 預測分析
    • 對企業未來發展做出預測

資料分析步驟

  • 宏觀上明确分析目的和步驟
  • 收集用于解決問題的資料
  • 對收集的資料進行預處理
  • 微觀上進行具體的資料分析
  • 對分析結果進行可視化展示
  • 針對分析結果撰寫報告

資料分析的誤區

  • 為了分析而分析
  • 缺乏業務知識,分析結果不實際
  • 強行套用進階模型而忘了簡單就是最好

資料分析師的要求

  • 懂業務
  • 懂管理
  • 懂分析
  • 懂技術
  • 懂設計

常用名額

  • 平均數
  • 絕對數、相對數
  • 百分比、百分點
  • 頻數、頻率
  • 比例、比率
  • 倍數、番數
  • 同比、環比

二、确定分析目的和思路(宏觀)

資料分析方法論與資料分析方法的差別

  • 方法論主要是宏觀角度指導如何進行資料分析
  • 資料分析方法指的是具體的分析法,比如對比分析

主要的資料分析方法論

  • PEST
    • 結合Politic(政治)分析
    • 結合Econconnomic(經濟)分析
    • 結合Social(社會)分析
    • 結合Technological(技術)分析
  • 5W2H
    • Why(何因)
    • What(何事)
    • Who(何人)
    • When(何時)
    • Where(何地)
    • How Much(何價)
    • How(如何做)
  • 邏輯樹
    • 問題
      • 問題1
        • 問題1第一方面
        • 問題1第二方面
      • 問題2
        • 問題2第一方面
        • 問題2第二方面
      • 問題3
        • 問題3第一方面
        • 問題3第二方面
  • 4P
    • Product(産品)
    • Price(價格)
    • Place(管道)
    • Promotion(促銷)
  • 使用者使用行為
    • 使用者認知産品
    • 使用者熟悉産品
    • 使用者試用産品
    • 使用者使用産品
    • 使用者忠實産品

三、如何準備資料

資料了解

  • 字段與記錄
    • 字段:特征
    • 記錄:特征的具體值
  • 資料類型
    • 字元型
    • 數值型
    • 其他
  • 資料表
    • 字段
    • 記錄
    • 資料類型

資料來源

  • 導入資料
    • 網站資料
    • 文本資料
    • 資料庫
    • 其他
  • 問卷調查
    • 數值題
    • 單選題
    • 多選題
    • 排序題
    • 簡單開放題

四、資料預處理

資料清洗

  • 缺失值
  • 重複值
  • 邏輯錯誤值

資料加工

  • 資料抽取
    • 字段分裂
    • 字段合并
    • 字段配置設定
  • 資料計算
    • 簡單計算
    • 函數計算
  • 資料分組
  • 資料轉換

資料抽樣

  • 普查
  • 抽樣調查

五、資料分析的方法(微觀)

現狀分析

  • 對比分析
    • 靜态比較
    • 動态比較
  • 平均分析
    • 分析業務的一般水準
    • 名額:算術平均數、權重平均數、幾何平均數
  • 綜合評價分析
    • 确定綜合評價體系名額
    • 收集資料,做标準化處理
    • 确定各名額權重
    • 計算綜合得分
    • 對綜合得分排序

原因分析

  • 分組分析
    • 等距分組
    • 不等距分組
  • 結構分析
    • 總體某部分數值/總體總量
  • 交叉分析
    • 交叉表
  • 杜邦分析
    • 杜邦财務分析系統
  • 漏鬥圖分析
    • 業務流程
  • 矩陣關聯分析
    • 根據重要性進行分類關聯
    • 象限矩陣
  • 聚類分析

預測分析

  • 回歸分析
  • 時間序列
  • 決策樹
  • 神經網絡

六、可視化圖表及美化

圖表作用

  • 表達形象化
  • 突出重點

常用圖表

  • 條形圖
  • 折線圖
  • 柱狀圖
  • 餅圖
  • 散點圖

圖表選擇

  • 描述性統計中不同圖表适用的資料類型:

    分類資料:條形圖、柱狀圖、餅圖、帕累托圖、環形圖

    連續資料:直方圖、莖葉圖、箱線圖、線圖(時間序列資料)

    多變量資料:散點圖、氣泡圖

    資料分析架構整理--基于《誰說菜鳥不會資料分析——入門篇》

圖表制作五步法

  • 确定表達問題
  • 确定那種圖表适合該問題
  • 選擇資料制作圖表
  • 檢查是否有效的展示資料
  • 檢查是否表達了問題

進階圖表

  • 平均線圖
    • 增加對比
  • 雙坐标圖
  • 豎型折線圖
  • 瀑布圖
  • 帕累托圖
    • 80%的價值又20%的人貢獻
  • 旋風圖
    • 名額對比
  • 人口金字塔圖
    • 反應過去、現在和未來的發展情況
  • 漏鬥圖
    • 上下名額直接的聯系
  • 矩陣圖及發展矩陣圖
  • 氣泡圖

圖示美化

  • 注意标題、圖例、機關、腳注等資訊
  • 簡約、整潔、對比
  • 色彩搭配、字型、格式

七、資料分析報告

報告撰寫原則

  • 規範性
  • 創新性
  • 實事求是

報告的作用

  • 展示分析結果
  • 驗證分析品質
  • 提供決策參考

報告的種類

  • 專題分析報告
    • 對某一問題或方面進行分析
    • 單一性
    • 深入性
  • 綜合分析報告
    • 系統分析某個對象的個個方面
    • 全面性
    • 聯系性
  • 日常分析報告
    • 定期資料分析、反應計劃執行情況
    • 進度性
    • 時效性

報告的結構

  • 标題頁
    • 題目要幹練,最好一到兩行
  • 目錄
    • 相當于資料分析的大概
  • 前言
    • 分析背景
      • 為何要展開此次分析?有何意義
    • 分析目的
      • 能解決什麼問題?達到何種目的
    • 分析思路
      • 從那些方面展開分析
  • 正文
    • 系統全面的表述分析過程和結果
  • 結論和建議
    • 結論是以分析結果為依據得到的分析結果
    • 建議是對業務現有問題提出的解決方案
  • 附錄
    • 正文中涉及而未闡述的資料

繼續閱讀