天天看點

《機器學習與資料科學(基于R的統計學習方法)》——1.8 使用R包

本節書摘來異步社群《機器學習與資料科學(基于r的統計學習方法)》一書中的第1章,第1.8節,作者:【美】daniel d. gutierrez(古鐵雷斯),更多章節内容可以通路雲栖社群“異步社群”公衆号檢視。

r以一種非常積極的方式擁抱開源,通過使用所謂的“包”來擴充軟體的基本功能。有大量的通用包(目前大約是7000個),其中很多涉及有用的統計方法,也有特定領域的包:金融、天文學、分子生物學、生态學等。你可以用下面給出的r腳本來找到當下可用的r包數目:

r包貢獻在綜合r歸檔網(cran,the comprehensive r archive network)中,這是一個由世界各地的專家維護的資源庫。為了找到離你地理位置最近的cran鏡像,請通路www.r-project.org,點選cran連結,選擇你的國家/位置。在那裡,你可以看到一頁按名稱排列的可用cran包。這個網頁非常長,是以你需要使用浏覽器的find工具來通過關鍵詞來搜尋。例如,有6個r包的名字中含有關鍵詞“金融(finance)”。也有一些在cean上找不到的私有r包,你可以用谷歌來查找并下載下傳安裝到你本地配置中。

一旦找到了滿足你需求的r包,你需要在本地配置中安裝它。例如,這是安裝lubridate包的指令:

一個包隻能安裝一次。安裝完成後,你需要做的是用library()把它加載到記憶體中。library()函數用來加載基礎r配置中未包括的函數庫(函數和資料集的集合)。

繼續閱讀