第1 章 資料分析概況 /1
1.1 資料分析定義(What) /2
1.2 資料分析作用(Why) /4
1.3 資料分析步驟(How) /5
1.3.1 明确分析目的和思路 /6
1.3.2 資料收集 /7
1.3.3 資料處理 /9
1.3.4 資料分析 /9
1.3.5 資料展現 /10
1.3.6 報告撰寫 /10
1.4 資料分析的三大誤區 /12
1.5 常用的資料分析工具 /13
1.5.1 Excel /13
1.5.2 SPSS /14
1.5.3 R語言 /15
1.5.4 Python語言 /16
第2 章 Python 概況 /17
2.1 Python簡介 /18
2.2 Python特點 /19
2.3 Python子產品 /20
2.3.1 函數 /20
2.3.2 子產品 /24
2.4 Python使用場景 /27
2.5 Python 2與Python 3 /28
2.6 Python與資料科學 /29
2.7 Anaconda簡介 /30
2.8 安裝Anaconda /31
2.8.1 下載下傳Anaconda /31
2.8.2 安裝Anaconda /33
2.9 使用Anaconda /37
2.9.1 PyCharm 與Spyder /37
2.9.2 Anaconda 開始菜單 /38
2.9.3 Spyder 工作界面簡介 /39
2.9.4 項目管理 /40
2.9.5 代碼提示 /43
2.9.6 變量浏覽 /44
2.9.7 圖形檢視 /44
2.9.8 幫助文檔 /45
第3 章 程式設計基礎 /47
3.1 資料類型 /48
3.1.1 數值型 /48
3.1.2 字元型 /50
3.1.3 邏輯型 /56
3.2 指派和變量 /57
3.2.1 指派和變量 /57
3.2.2 變量命名規則 /58
3.3 資料結構 /59
3.3.1 清單 /59
3.3.2 字典 /63
3.3.3 序列 /66
3.3.4 資料框 /72
3.3.5 四種資料結構的差別 /80
3.4 向量化運算 /81
3.5 for 循環 /83
3.6 Python 程式設計注意事項 /87
第4 章 資料處理 /90
4.1 資料導入與導出 /91
4.1.1 資料導入 /91
4.1.2 資料導出 /99
4.2 資料清洗 /100
4.2.1 資料排序 /101
4.2.2 重複資料處理 /102
4.2.3 缺失資料處理 /106
4.2.4 空格資料處理 /109
4.3 資料轉換 /110
4.3.1 數值轉字元 /110
4.3.2 字元轉數值 /112
4.3.3 字元轉時間 /113
4.4 資料抽取 /115
4.4.1 字段拆分 /116
4.4.2 記錄抽取 /121
4.4.3 随機抽樣 /127
4.5 資料合并 /130
4.5.1 記錄合并 /130
4.5.2 字段合并 /133
4.5.3 字段比對 /135
4.6 資料計算 /140
4.6.1 簡單計算 /140
4.6.2 時間計算 /141
4.6.3 資料标準化 /142
4.6.4 資料分組 /144
第5 章 資料分析 /148
5.1 對比分析 /149
5.2 基本統計分析 /152
5.3 分組分析 /155
5.4 結構分析 /158
5.5 分布分析 /159
5.6 交叉分析 /162
5.7 RFM 分析 /164
5.8 矩陣分析 /173
5.9 相關分析 /176
5.10 回歸分析 /178
5.10.1 回歸分析簡介 /178
5.10.2 簡單線性回歸分析 /180
5.10.3 多重線性回歸分析 /185
第6 章 資料可視化 /189
6.1 資料可視化簡介 /190
6.1.1 什麼是資料可視化 /190
6.1.2 資料可視化常用圖表 /190
6.1.3 通過關系選擇圖表 /191
6.2 散點圖 /192
6.3 矩陣圖 /203
6.4 折線圖 /210
6.5 餅圖 /215
6.6 柱形圖 /217
6.7 條形圖 /222