天天看點

《R語言資料挖掘:實用項目解析》——導讀

本節書摘來自華章出版社《r語言資料挖掘:實用項目解析》一書中的導讀,作者[印度]普拉迪帕塔·米什拉(pradeepta mishra),更多章節内容可以通路雲栖社群“華章計算機”公衆号檢視

《R語言資料挖掘:實用項目解析》——導讀

目  錄

前言

第1章 使用r内置資料進行資料處理

<a href="https://yq.aliyun.com/articles/90293">1.1 什麼是資料挖掘</a>

<a href="https://yq.aliyun.com/articles/90312">1.2 r語言引論</a>

1.2.1 快速入門

1.2.2 資料類型、向量、數組與矩陣

1.2.3 清單管理、因子與序列

1.2.4 資料的導入與導出

<a href="https://yq.aliyun.com/articles/90320">1.3 資料類型轉換</a>

<a href="https://yq.aliyun.com/articles/90337">1.4 排序與合并資料框</a>

<a href="https://yq.aliyun.com/articles/90342">1.5 索引或切分資料框</a>

<a href="https://yq.aliyun.com/articles/90351">1.6 日期與時間格式化</a>

<a href="https://yq.aliyun.com/articles/90357">1.7 建立新函數</a>

1.7.1 使用者自定義函數

1.7.2 内置函數

<a href="https://yq.aliyun.com/articles/90363">1.8 循環原理——for循環</a>

<a href="https://yq.aliyun.com/articles/90364">1.9 循環原理——repeat循環</a>

<a href="https://yq.aliyun.com/articles/90366">1.10 循環原理——while循環</a>

<a href="https://yq.aliyun.com/articles/90370">1.11 apply原理</a>

<a href="https://yq.aliyun.com/articles/90372">1.12 字元串操作</a>

<a href="https://yq.aliyun.com/articles/90375">1.13 缺失值(na)的處理</a>

<a href="https://yq.aliyun.com/articles/90380">小結</a>

第2章 汽車資料的探索性分析

<a href="https://yq.aliyun.com/articles/90389">2.1 一進制分析</a>

<a href="https://yq.aliyun.com/articles/90392">2.2 二進制分析</a>

<a href="https://yq.aliyun.com/articles/90396">2.3 多元分析</a>

<a href="https://yq.aliyun.com/articles/90400">2.4 解讀分布和變換</a>

2.4.1 正态分布

2.4.2 二項分布

2.4.3 泊松分布

<a href="https://yq.aliyun.com/articles/90404">2.5 解讀分布</a>

<a href="https://yq.aliyun.com/articles/90406">2.6 變量分段</a>

<a href="https://yq.aliyun.com/articles/90415">2.7 列聯表、二進制統計及資料正态性檢驗</a>

<a href="https://yq.aliyun.com/articles/90441">2.8 假設檢驗</a>

2.8.1 總體均值檢驗

2.8.2 雙樣本方差檢驗

<a href="https://yq.aliyun.com/articles/90434">2.9 無參數方法</a>

2.9.1 wilcoxon符号秩檢驗

2.9.2 mann-whitney-wilcoxon檢驗

2.9.3 kruskal-wallis檢驗

<a href="https://yq.aliyun.com/articles/90444">小結</a>

第3章 可視化diamond資料集

3.1 使用ggplot2可視化資料

3.1.1 條狀圖

3.1.2 盒狀圖

3.1.3 氣泡圖

3.1.4 甜甜圈圖

3.1.5 地理制圖

3.1.6 直方圖

3.1.7 折線圖

3.1.8 餅圖

3.1.9 散點圖

3.1.10 堆疊柱形圖

3.1.11 莖葉圖

3.1.12 詞雲

3.1.13 鋸齒圖

3.2 使用plotly

3.2.1 氣泡圖

3.2.2 用plotly畫條狀圖

3.2.3 用plotly畫散點圖

3.2.4 用plotly畫盒狀圖

3.2.5 用plotly畫極坐标圖

3.2.6 用plotly畫極坐标散點圖

3.2.7 極坐标分區圖

3.3 建立地理制圖

小結

第4章 用汽車資料做回歸

4.1 回歸引論

4.1.1 建立回歸問題

4.1.2 案例學習

4.2 線性回歸

4.3 通過逐漸回歸法進行變量選取

4.4 logistic回歸

4.5 三次回歸

4.6 懲罰回歸

第5章 基于産品資料的購物籃分析

5.1 購物籃分析引論

5.1.1 什麼是購物籃分析

5.1.2 哪裡會用到購物籃分析

5.1.3 資料要求

5.1.4 前提假設/要求

5.1.5 模組化方法

5.1.6 局限性

5.2 實際項目

5.2.1 先驗算法

5.2.2 eclat算法

5.2.3 可視化關聯規則

5.2.4 實施關聯規則

第6章 聚類電商資料

6.1 了解客戶分類

6.1.1 為何了解客戶分類很重要

6.1.2 如何對客戶進行分類

6.2 各種适用的聚類方法

6.2.1 k均值聚類

6.2.2 層次聚類

6.2.3 基于模型的聚類

6.2.4 其他聚類算法

6.2.5 聚類方法的比較

參考文獻

第7章 建構零售推薦引擎

7.1 什麼是推薦

7.1.1 商品推薦類型

7.1.2 實作推薦問題的方法

7.2 前提假設

7.3 什麼時候采用什麼方法

7.4 協同過濾的局限

7.5 實際項目

第8章 降維

8.1 為什麼降維

8.2 降維實際項目

8.3 有參數法降維

第9章 神經網絡在醫療資料中的應用

9.1 神經網絡引論

9.2 了解神經網絡背後的數學原理

9.3 用r語言實作神經網絡

9.4 應用神經網絡進行預測

9.5 應用神經網絡進行分類

9.6 應用神經網絡進行預測

9.7 神經網絡的優缺點

繼續閱讀