天天看點

《從Excel到R 資料分析進階指南》一1.2 建立資料表

本節書摘來自異步社群《從excel到r 資料分析進階指南》一書中的第1章,第1.2節,作者 王彥平(藍鲸),更多章節内容可以通路雲栖社群“異步社群”公衆号檢視

另一種方法是通過直接寫入資料來生成資料表。excel中直接在單元格中輸入資料,r中通過下面的代碼來實作。資料表一共有7行資料,每行有5個字段。在資料中我們特意設定了一些na值和有問題的字段,例如包含空格和重複值等。後面将在資料清洗步驟進行處理。後面我們将統一以dataframe的簡稱df來命名資料表。

《從Excel到R 資料分析進階指南》一1.2 建立資料表

這是剛剛建立的資料表,我們沒有設定索引列,price字段中包含有na值,city字段中還包含了一些髒資料。最後一行包含了重複值。