天天看點

2013年資料分析、資料挖掘、資料科學使用語言排行榜

2013年資料分析、資料挖掘、資料科學使用語言排行榜

 最受歡迎的語言仍然是r( kdnuggets 讀者中有61%使用者在用),python(39%),sql(37%).sas仍然穩定在20%之間。增長最快是:pig/hive/hadoop為基礎的語言、r、sql,同時perl, c/c++, 與unix 在下降。同時我們發現,r與python使用者存在一定的重疊。

之前的kdnuggets的調查主要是關注:統計與分析軟體,但有時候一個全面與強大的程式設計語言是需要的。這也是最近一次的kdnuggets調查關注的重點,我們咨詢:

在2013年中,什麼樣的程式或者統計語言你是在做分析、挖掘、科學計算的時候所需要的?

基于超過對700名會員的調查,最受歡迎的仍然是r語言(61%的調研會員在用),python(39%),sql(37%),平均每個調研對象使用2.3種語言。

趨勢對比過去二年的調查結果,發現2013的趨勢是一樣的:

2012年調查:什麼樣的語言可用于資料分析與資料挖掘。

2011年調查:什麼樣的語言可用于資料分析與資料挖掘。

· 增長率最高的語言,對比2013 vs 2012是julia,使用人員增加超過2倍。但仍然是一門小衆語言,在2013年也僅有0,7%的使用者使用。

· 在比較普通的使用語言中:增加相對較大的語言,對比 2013 vs 2012:

· 以hadoop為基礎的語言:pig latin/hive/other,19%的環比增長,從2012年的6.7%增加到2013。

· r,16%的環比增長。

· sql,14%的增長(sql的增長是的來源于hadoop和其它的大資料系統中的sql接口增長)。

語言的使用份額下降最大的是:

lisp/clojure, 77% 下降

perl, 50%  下降

ruby, 41%  下降

c/c++, 35%  下降

unix shell/awk/sed, 25%  下降

java, 22%  下降

r與python的使用者是否有重合呢?是的。在使用r語言的13%的使用者中,更可能使用python與總體相比要高出13%。下面是哪些語言更可能被r語言使用者使用(與總體相比)。

2013年資料分析、資料挖掘、資料科學使用語言排行榜

評論:

有一些評論說,比如:指出spss也是自己的文法和sas一樣--在下次的調研中,我們将會包括進來。

樣本的區域分布為:

us/canada, 50.8%,

europe: 25.7%,

asia: 11.8%,

latin america: 6.7%,

au/nz: 3.2%,

africa/middle east: 1.5%

<b></b>

<b>原文釋出時間為:2013-08-30</b>

<b>本文來自雲栖社群合作夥伴“大資料文摘”,了解相關資訊可以關注“bigdatadigest”微信公衆号</b>