兩種最常用的資料科學語言R和Python之間存在着某種競争。
剛接觸機器學習的人都會選擇其中一種語言來學習。人們的決定通常以他們可以通路的學習資源為指導,比如哪些資源在他們的工作領域中更常用,以及哪些是他們的同僚正在使用的。盡管一些更先進的深度學習方法更容易通過使用Python來編寫實作(它們傾向于先用Python編寫,再用R語言實作),但是機器學習任務不可能隻适用于一種或另一種語言。雖然非常适合資料科學,但Python是一種更通用的程式設計語言,而R語言專門針對數學和統計學的相關應用。這意味着使用R語言的人可以隻關注資料,但是,如果他們需要基于自己的模型建構應用程式,他們可能會感到自己受到了限制。
當R和Python在資料科學領域互相競争時,确實沒有哪一種語言是絕對的赢家(每個人都有自己喜歡的語言)。那麼,本書為何選用R語言介紹機器學習呢?因為R語言有專門用于簡化資料科學任務并使之易于人們閱讀的現代工具,例如 tidyverse程式包中的工具(我們将在第2章深入介紹這些工具)。

一般而言,使用R語言編寫的機器學習算法存在于多個不同的程式包中。這意味着每次想應用新的算法時,都需要學習如何使用具有不同參數且實作不同功能的新函數。在這方面,Python的優勢在于提供了著名的scikit-learn程式包,其中内置了大量的機器學習算法。R語言現在也有了改進,增加了caret和 mlr程式包。雖然mlr程式包在用途和功能上與caret程式包非常相似,但筆者認為mlr程式包更靈活、更直覺。是以,我們選擇在本書中使用mlr程式包。
mlr程式包為大量的機器學習算法提供了一個接口,這樣就可以使用很少的代碼執行極其複雜的機器學習任務。
節選自《機器學習實戰:使用R、tidyverse和mlr》一書
———————————————————————————————————————————基本資訊
書名: 《機器學習實戰:使用R、tidyverse和mlr》
IBSN:9787302578277
定價:118元
作者譯者:[英]赫芬·I.裡斯(Hefin Rhys) 著;但波,高山,韓建立 譯
出版時間:2021年6月
京東連結:https://item.m.jd.com/product/13331454.html
———————————————————————————————————————————
試讀樣章
想了解更多關于《機器學習實戰:使用R、tidyverse和mlr》内容,請點選京東連結:https://item.m.jd.com/product/13331454.html