天天看點

《Clojure資料分析秘笈》——1.3節将CSV資料讀入Incanter資料集

本節書摘來自華章社群《clojure資料分析秘笈》一書中的第1章,第1.3節将csv資料讀入incanter資料集,作者(美)eric rochester,更多章節内容可以通路雲栖社群“華章社群”公衆号檢視

1.3 将csv資料讀入incanter資料集

以逗号分隔值(csv)是最簡單的資料格式之一,并且這種資料格式應用非常普遍。excel可以直接讀寫csv檔案,而且多數資料庫也可以。由于csv檔案就是無格式的文本,是以使用任何程式設計語言都很容易生成或者通路它。

1.3.1 準備工作

《Clojure資料分析秘笈》——1.3節将CSV資料讀入Incanter資料集

1.3.2 具體實作

使用incanter.io/read-dataset函數。

《Clojure資料分析秘笈》——1.3節将CSV資料讀入Incanter資料集

1.3.3 實作原理

通過clojure和incanter可以使許多普通工作變得簡單,下面是一個很好的例證。

讀入外部資料(在本例中來自csv檔案),并将其加載到incanter資料集中。在incanter中,一個資料集就是一張表,類似于電子表格中的一個表單或者資料庫中的表。每一列包含一個資料域,每一行包含一條資料。有些列包含字元串資料(本例中所有列都是字元串資料),有些列包含日期或者數值資料。如果一列包含數值資料,incanter會自動将其檢測出來并将其轉換為java中的int或者double資料格式。incanter解決了導入資料過程中遇到的許多令人頭疼的問題。

1.3.4 更多資訊