天天看點

【機器學習工具榜單】Tensorflow最多使用,Python 取代 R 成最受歡迎程式設計語言

近日,KDnuggets網站公布了2018年度的資料科學和機器學習工具調查結果。2300多名參與者對自己“過去 12 個月内在項目開發中使用過的資料挖掘 / 機器學習工具和程式設計語言”進行了投票。

最受歡迎的分析、資料科學、機器學習工具

【機器學習工具榜單】Tensorflow最多使用,Python 取代 R 成最受歡迎程式設計語言

圖1:2018年最受歡迎的分析/資料科學/機器學習工具,以及與2016~2017年調查結果的對比

下表列舉了最受歡迎的前11個工具,其中每個的占比都達到20%以上。

【機器學習工具榜單】Tensorflow最多使用,Python 取代 R 成最受歡迎程式設計語言

表1:2018年最受歡迎的分析/資料科學/ 機器學習軟體Top 10

上表中,2018 % share 是指使用這個工具的人占所有投票者的百分比,% change是指2018年相較2017年的投票變化。

每個受訪者平均使用的工具數量為7.0個,略高于2017年的6.75個(排除了隻選擇1個工具的投票)。

與2017年的軟體調查相比,今年新進入Top 10的是Keras。

Python取代R成為最受歡迎的程式設計語言

調查結果顯示,Python在2017年調查中的占比已經超過50%,今年更是增加到66%,而R語言的占比自這個調查開始以來(今年是第19屆)第一次下降到低于50%。

RapidMiner受歡迎程度大幅提高

在過去幾次調查中,RapidMiner都是排名最高的資料科學平台,今年其占比從2017年的33%上升到50%。不過,這是由于RapidMiner采取了一些措施鼓勵他們的使用者參與該調查。

SQL排名保持穩定

SQL,包括Spark SQL和SQL to Hadoop工具,在過去的3次投票中每一次都有大約40%的投票占比。是以,如果你是資料科學家,學習SQL吧——它很可能在很長一段時間裡都很有用。

趨勢

下表列舉了使用率增幅達到 20% 及以上,且2018 年使用率達到 3% 以上的工具。

【機器學習工具榜單】Tensorflow最多使用,Python 取代 R 成最受歡迎程式設計語言

表2:使用率增幅最大的主要分析/資料科學/機器學習工具

我們注意到,在2017年使用率達到2%或更高的56個工具中,有19個(約三分之一)在2018年使用率有所上升,而其餘37個的使用率下降了。這和近期的幾起收購(Datawatch收購Angoss, Minitab收購Salford)一起表明,資料科學平台的整合正在進行中。

下表列舉了在2017年使用率至少有3%的工具,今年下降了25%甚至更多。

【機器學習工具榜單】Tensorflow最多使用,Python 取代 R 成最受歡迎程式設計語言

表3:使用率跌幅最大的主要分析/資料科學工具。

深度學習工具

調查結果顯示,近幾年深度學習工具的使用比例保持穩定。今年的調查中有33%的投票者使用深度學習工具中,2017年和2016年的比率分别為32%和18%。

谷歌的TensorFlow仍然是是目前最受歡迎的深度學習平台,不過Keras的使用率也很高,接近TensorFlow。

PyTorch排在第3,使用率為6.4%。不過, KDnuggets 的讀者更多是資料科學領域的,這個資料可能不能完全反映這些深度學習工具在研究社群中的真實受歡迎程度。PyTorch在今年有一次較大的更新更新,并且與Caffe 2合并,預計未來它的使用率将會更高。

深度學習工具排名:

【機器學習工具榜單】Tensorflow最多使用,Python 取代 R 成最受歡迎程式設計語言

Tensorflow, 29.9%

【機器學習工具榜單】Tensorflow最多使用,Python 取代 R 成最受歡迎程式設計語言

Keras, 22.2%

【機器學習工具榜單】Tensorflow最多使用,Python 取代 R 成最受歡迎程式設計語言

PyTorch, 6.4%

【機器學習工具榜單】Tensorflow最多使用,Python 取代 R 成最受歡迎程式設計語言

Theano, 4.9%

【機器學習工具榜單】Tensorflow最多使用,Python 取代 R 成最受歡迎程式設計語言

Other Deep Learning Tools, 4.9%

【機器學習工具榜單】Tensorflow最多使用,Python 取代 R 成最受歡迎程式設計語言

DeepLearning4J, 3.4%

【機器學習工具榜單】Tensorflow最多使用,Python 取代 R 成最受歡迎程式設計語言

Microsoft Cognitive Toolkit (Prev. CNTK), 3.0%

【機器學習工具榜單】Tensorflow最多使用,Python 取代 R 成最受歡迎程式設計語言

Apache MXnet, 1.5%

【機器學習工具榜單】Tensorflow最多使用,Python 取代 R 成最受歡迎程式設計語言

Caffe, 1.5%

【機器學習工具榜單】Tensorflow最多使用,Python 取代 R 成最受歡迎程式設計語言

Caffe2, 1.2%

【機器學習工具榜單】Tensorflow最多使用,Python 取代 R 成最受歡迎程式設計語言

TFLearn, 1.1%

【機器學習工具榜單】Tensorflow最多使用,Python 取代 R 成最受歡迎程式設計語言

Torch, 1.0%

【機器學習工具榜單】Tensorflow最多使用,Python 取代 R 成最受歡迎程式設計語言

Lasagne, 0.3%

大資料工具:Hadoop的使用率有所下降

今年的調查中,大約33%的投票者使用了大資料工具,要麼是Hadoop,要麼是Spark——比率大緻與2017年相同,但Hadoop的使用率顯著下降了——約為30%。

詳細結果如下:

【機器學習工具榜單】Tensorflow最多使用,Python 取代 R 成最受歡迎程式設計語言

程式設計語言

Python取代R語言成為資料科學/機器學習開發者中最受歡迎的程式設計語言,而且也遠高于其他程式設計語言。SQL、Java、C/ C++的排名保持不變。

這是自KDnuggets網站開始進行這項調查以來,R的使用率首次下降。其他程式設計語言的使用率也有所下降。

以下是按受歡迎程度排序的主要程式設計語言。

【機器學習工具榜單】Tensorflow最多使用,Python 取代 R 成最受歡迎程式設計語言

Python, 65.6% (2017年是59.0%), 11% 上升

【機器學習工具榜單】Tensorflow最多使用,Python 取代 R 成最受歡迎程式設計語言

R, 48.5% (2017年是 56.6%), 14% 下降

【機器學習工具榜單】Tensorflow最多使用,Python 取代 R 成最受歡迎程式設計語言

SQL, 39.6% (2017年是 39.2%), 1% 上升

【機器學習工具榜單】Tensorflow最多使用,Python 取代 R 成最受歡迎程式設計語言

Java, 15.1% (2017年是 15.5%), 3% 下降

【機器學習工具榜單】Tensorflow最多使用,Python 取代 R 成最受歡迎程式設計語言

Unix, shell/awk/gawk, 9.2% (2017年是 10.8%), 15% 下降

【機器學習工具榜單】Tensorflow最多使用,Python 取代 R 成最受歡迎程式設計語言

Other programming and data languages, 6.9%, (2017年是 7.6%), -9% 下降

【機器學習工具榜單】Tensorflow最多使用,Python 取代 R 成最受歡迎程式設計語言

C/C++, 6.8%, (2017年是 7.1%), 3% 下降

【機器學習工具榜單】Tensorflow最多使用,Python 取代 R 成最受歡迎程式設計語言

Scala, 5.9%, (2017年是 8.3%), 29% 下降

【機器學習工具榜單】Tensorflow最多使用,Python 取代 R 成最受歡迎程式設計語言

Perl, 1.0% (2017年是 1.9%), 46% 下降

【機器學習工具榜單】Tensorflow最多使用,Python 取代 R 成最受歡迎程式設計語言

Julia, 0.7% (2017年是 1.2%), 45% 下降

【機器學習工具榜單】Tensorflow最多使用,Python 取代 R 成最受歡迎程式設計語言

Lisp, 0.3% (2017年是 0.4%), -25% 下降

【機器學習工具榜單】Tensorflow最多使用,Python 取代 R 成最受歡迎程式設計語言

Clojure, 0.2% (2017年是 0.3%), -38% 下降

【機器學習工具榜單】Tensorflow最多使用,Python 取代 R 成最受歡迎程式設計語言

F, # 0.1% (2017年是 0.5%), -73% 下降

原文釋出時間為:2018-06-1

本文作者:肖琴

本文來自雲栖社群合作夥伴新智元,了解相關資訊可以關注“AI_era”。

原文連結:

【機器學習工具榜單】Tensorflow最多使用,Python 取代 R 成最受歡迎程式設計語言