天天看點

《R語言與資料挖掘最佳實踐和經典案例》—— 1.1 資料挖掘

本節書摘來自華章出版社《r語言與資料挖掘最佳實踐和經典案例》一 書中的第1章,第1.2節,作者:(澳)yanchang zhao,更多章節内容可以通路雲栖社群“華章計算機”公衆号檢視。

r[r核心開發團隊,2012]是一個自由軟體,主要用于統計計算和統計制圖,它提供了大量的統計和制圖工具。r可以簡單地通過程式包的形式進行擴充,截至2012年8月1日,cran程式包庫中已經收藏了大約4000個程式包。更多關于r的詳細介紹可以參考《an introduction to r》(venables et al., 2010)和《r language definition》[r核心開發團隊, 2010b],這兩本書都可以從cran網站上擷取。r已經廣泛應用于學術界和工業界。

為了幫助使用者更快地找到需要使用的r程式包,cran提供了任務視圖(task views),将所有的r程式包按照不同的處理任務組織起來。與資料挖掘相關的幾個任務視圖是:

機器學習和統計學習。

聚類分析和有限混合模型。

時間序列分析。

多元統計。

空間資料分析。

另一個關于r實作資料挖掘的入門指導是《r reference card for data mining》,它提供了一套完整的用于資料挖掘的r程式包和函數的索引,并根據功能進行分類。

讀者想要了解更多關于r的詳細資訊,可以參考第15章的線上資源。

繼續閱讀