天天看點

《R語言資料挖掘:實用項目解析》——1.6 日期與時間格式化

本節書摘來自華章計算機《r語言資料挖掘:實用項目解析》一書中的第1章,第1.6節,作者[印度]普拉迪帕塔·米什拉(pradeepta mishra),譯 黃芸,更多章節内容可以通路雲栖社群“華章計算機”公衆号檢視。

日期函數傳回的是一個date類,表示自1970年1月1日以來的天數。as.numeric()函數可用于建立一個值為自1/1/1970以來的天數的數值型變量。as.date()的傳回值是一個date類的對象:

《R語言資料挖掘:實用項目解析》——1.6 日期與時間格式化

系統時間函數提取了日期和時區時間。當用as.date函數轉換系統時間并将其存儲為r中的一個新對象時,我們發現那個對象的類是date。weekdays函數傳回星期名,如“星期一”或者“星期三”。months函數傳回日期變量中的月名。quarters函數傳回日期對象的季名。年份值也可利用substr()指令提取。示例如下:

《R語言資料挖掘:實用項目解析》——1.6 日期與時間格式化
《R語言資料挖掘:實用項目解析》——1.6 日期與時間格式化

如果資料集中給出的日期變量的格式不适用于進一步計算,可以用format函數将其格式化:

《R語言資料挖掘:實用項目解析》——1.6 日期與時間格式化

下表所示的多種選項均可基于使用者需求傳遞給格式參數。

《R語言資料挖掘:實用項目解析》——1.6 日期與時間格式化

實際資料集包含的時間資料域有零售中的交易日期、健康服務中的通路日期和bfsi中的處理日期,還有包含至少一個時間元素的時間序列資料。要将日期變量納入任何統計模型,都需要進行資料轉換,比如在零售業場景中計算顧客的曆史記錄。資料轉換可以使用上文提及的選項完成。

繼續閱讀