天天看點

嘗試一下Apache的開源服務吧!這是由AWS提供的

open source insider令人值得關注的是,apache software foundation本月接受了mxnet機器學習項目(mxnet machine learning)作為一個開放源代碼項目。

嘗試一下Apache的開源服務吧!這是由AWS提供的

這個公告最讓人驚訝的并不是asf在衆多選擇中接受了這個項目,現在在軟體世界裡如果沒有機器學習工具就很難翻身,而是mxnet的開發人員絕大部分都來自于亞馬遜,他們相信asf是相關的。

mxnet是一個開放源代碼的“深度學習”架構,允許您在各種裝置上定義、訓練和部署所謂的神經網絡。它也恰好是amazon web services(aws)上機器學習(ml)工具的選擇,并且通過已經部署好的ec2執行個體可用。

深度學習是目前非常流行的機器學習的子集,專注于具有非線性的分層算法,這有助于在資料集中找到模式和學習陳述。說它在發現的時候學習,這是一種奇怪的說法。由于它在語音識别、自然語言了解和推薦系統(例如siri、alexa等)等應用程式中取得了成功,深度學習目前廣受歡迎。每次當你坐在沙發上對着alexa大喊大叫,都是在使用深度學習系統。

亞馬遜聲稱mxnet是該公司擁有的最具擴充性的工具,這讓mxnet在現在這個階段變得非常有趣,亞馬遜可是一家知道哪些東西具有擴充性而哪些東西沒有擴充性的公司。

mxnet遠非深度學習領域唯一的寵兒。事實上,它加入這場遊戲的時候已經有點晚了。深度學習世界中的其他流行工具包括在facebook、谷歌和nyu使用的torch以及微軟的adam,但也許最大的直接競争對手是谷歌的tensorflow。tensorflow是開放源代碼的,使用apache許可證,并在本月釋出了1.0版本,客戶已經開始使用了。

谷歌在aws上使用tensorflow已經超過一年了。谷歌已經在旗下很多谷歌服務,例如gmail和google photos上使用它,而且谷歌在2015年11月針對滿懷熱情的測試者們提供了一個穩定的版本,比aws收購mxnet早了整整12個月。去年六月,谷歌聲稱github上有1500個存儲庫提到了tensorflow,其中隻有五個來自于谷歌自己。

如果你是開放源代碼世界中的新人,機器學習工具和開發人員通常都是如此,那麼你對于asf缺乏真正的了解是可以被原諒的。

即使你非常熟悉asf,你可能仍然好奇為什麼像亞馬遜這樣一家數十億美元的公司會對于一個全是由志願者組成的團體采用其寵愛的項目感到如此興奮?要知道asf一年的營運費用才幾乎不到50萬美元。

答案隻用一個詞就夠了:社群。

asf成立于1999年,完全由捐款資助,asf系統首先幫助apache http伺服器成為網絡上最受歡迎的網絡伺服器。這一成功公式已經被一些最新的成功重複證明,包括hadoop、 spark、tomcat和struts。在受到對openoffice破壞性的控制的傷害之後,oracle将openoffice放到asf中,希望以此幫助其得到更廣泛的采用。

asf孵化器的目的是幫助外部項目提高他們的代碼的品質,并參與更大的社群。它是一種開放源代碼項目的蓋章認可,證明項目是真正開放源代碼的,并使用asf的表決程式和asf已經開發的所有其他的準民主治理體系,也就是被神聖化地成為apache way的方法。

考慮到這種社群和tensorflow社群之間的選擇,toxflow社群雖然是開放源代碼的,但卻在很大程度上受到谷歌的管理,mxnet就變得看起來更具吸引力。而且它的吸引力越大,參與的開發者就會越多,而代碼也會越好。如果你從機器學習的角度來思考它的話,那麼asf就是一個開發人員的學習網絡。

值得注意的是,并非所有進入asf孵化器的項目都能夠“脫離父母”。但正式的項目在能夠證明自己獨立于任何一個貢獻者或者贊助實體之前,都不能完成孵化階段。

孵化是一個項目成為asf正式項目的第一步,但不能保證項目在asf的支援下最終會成功還是終止。

孵化器的成功項目包括cassandra、couchdb、mesos以及其他很多項目。還有openoffice,另一個孵化器的“畢業生”,但是它的風頭在很大程度上被libreoffice奪走了。

現在亞馬遜希望mxnet可以從asf學到一些技巧,或許建立一個可以幫助其趕上競争對手的社群。作為aws人工智能的總經理,matt wood表示,該項目希望成為apache孵化器的一部分的原因是“利用apache software foundation的流程、管理、外延和社群活動。

簡而言之,想利用asf的影響力來吸引更多的開發者。很容易看明白亞馬遜的這一舉動是完全為了自己,事實上也是如此,但這隻是這個故事的開始。

也許asf的名字不再家喻戶曉,但它仍然有相當的影響力,它的治理和所謂的apache way真的發展出了一些令人印象深刻、發展得非常好的社群項目。由于mxnet背後的原因,它打敗tensorflow和其他産品的可能性相當大。

當然,asf可能得到的是迄今為止最好的機器學習項目。mxnet當然是最容易部署的一種,因為已經有一個aws深度學習ami可用了,還有大量的預編譯好并已經為使用做好準備的示例代碼。之前提到的伺服器執行個體恰好與其他aws服務密切相關,而使用者可能想要投資的伺服器執行個體也是如此。

原文釋出時間為:2017年2月26日 

本文作者:作者:李超

本文來自雲栖社群合作夥伴至頂網,了解相關資訊可以關注至頂網。