天天看點

《R語言資料挖掘:實用項目解析》——2.2 二進制分析

本節書摘來自華章計算機《r語言資料挖掘:實用項目解析》一書中的第2章,第2.2節,作者[印度]普拉迪帕塔·米什拉(pradeepta mishra),譯 黃芸,更多章節内容可以通路雲栖社群“華章計算機”公衆号檢視。

二進制分析是指研究兩個變量之間的關系或關聯。有三種可能的方向:

數值-數值的關系

數值-分類的關系

分類-分類的關系

假設要判斷兩個數值變量之間的二進制關系。若兩個變量恰好都是連續型,則通常使用散點圖;如果一個變量是分類型,另一個是連續型,則使用條形圖:

《R語言資料挖掘:實用項目解析》——2.2 二進制分析
《R語言資料挖掘:實用項目解析》——2.2 二進制分析

類似的,價格(price)和高速路英裡數(highway mileage)之間的關系也可用散點圖表示:

《R語言資料挖掘:實用項目解析》——2.2 二進制分析
《R語言資料挖掘:實用項目解析》——2.2 二進制分析

數值-分類和分類-分類關系的分析會在第3章可視化diamond資料集中予以詳細解釋。

繼續閱讀