天天看點

《R語言資料挖掘:實用項目解析》——第2章,第2.10節小結

本節書摘來自華章出版社《r語言資料挖掘:實用項目解析》一書中的第2章,第2.10節小結,作者[印度]普拉迪帕塔·米什拉(pradeepta mishra),更多章節内容可以通路雲栖社群“華章計算機”公衆号檢視

小結

探索性資料分析幾乎是所有類型的資料挖掘項目都要執行的一項重要操作。解讀分布、分布的形狀和分布的重要參數是相當重要的。提前的假設檢驗可幫助我們更好地了解資料。不僅是分布及其性質,不同變量之間的關系也很重要。是以本章介紹了不同變量之間的二進制和多元關系以及如何了解這些關系。諸如t檢驗、f檢驗、z檢驗和無參數檢驗等經典統計檢驗都是檢驗假設的重要方法。檢驗假設本身對于從資料集中得出結論和洞見也很重要。

本章我們介紹了多種統計檢驗和它們的用法、說明以及可以使用這些檢驗的場景。在實施探索性資料分析之後,下一章将介紹一些資料可視化方法來使讀者對資料有個全方位的了解。有時,圖形化的描述是最簡單的資料展示方法。下一章将使用不同庫中的一些内置資料集來建立直覺的可視化。

繼續閱讀