r是一種高品質、跨平台、靈活且廣泛使用的開源免費語言,可用于統計學、圖形學、數學和資料科學。它由統計學家建立,并為統計學家服務。
r語言包含了5000多種算法以及全球範圍内具備專業知識的數百萬使用者,并得到了充滿活力且富有才華的社群貢獻者的支援。它不僅可以使用完善的統計技術,也允許使用試驗性的統計技術。
r是一個用于統計計算與圖形學的免費開源軟體,其環境由r-projects維護,根據自由軟體基金會(free software foundation)的gnu通用公共授權(general public license)的條款,r語言的源代碼是可以獲得的。由于存在各種平台,如unix、linux、windows以及mac os,是以r語言也編譯和開發了用于不同平台的版本。
r存在以下3個缺點:
一個缺點就是記憶體限制,是以它需要将整個資料集存儲在記憶體(ram)中以便實作高性能,這也稱為記憶體分析。
類似于其他開源系統,任何人都可以建立和貢獻經過嚴格測試或者未經過嚴格測試的程式包。換言之,貢獻給r社群的程式包是容易出錯的,需要更多的測試以確定代碼的品質。
r語言似乎比某些其他商業語言慢。
幸運的是,存在可用于解決這些問題的程式包。有些方法可以歸為并行解決方案,本質就是将程式的運作分散到多個cpu上,進而克服上面所列r語言的缺陷。有不少好的例子,比如rhadoop,但并不局限于rhadoop。你很快就會在下面的章節中看到更多關于這個話題的内容。你可以從綜合r典藏網(comprehensive r archive network,cran)下載下傳snow添加包和parallel添加包。