算法統治世界。
好吧,最起碼算法統治網際網路。但是鑒于網際網路即将統治世界,是以這句話也沒錯。算法決定了你用 google 搜尋的結果,算法決定了新浪微網誌側欄向你展示的話題,算法決定了 netflix 向你推薦的電影,算法決定了你 qq 對話窗彈出的橫幅廣告。技術巨頭花費了大量時間來研究新算法以及調整舊算法。但是有些現成的算法卻罕有人知曉—那些學院的計算機科學研究人員花費數年開發的算法,哪怕對工程師們非常有用,在學術圈以外卻很少有人能看到。
在微軟幫助開發 excel、power pivot 等工具的資料分析功能的 diego oppenheimer 太清楚了這一點了。他一直在尋找更好的算法以便內建到應用中,最後卻是衆裡尋她千百度,那人卻在燈火闌珊處—往往答案就在微軟研究院那裡。于是他感慨,很多别人已經研究多年的算法自己卻從未聽說過。
而另一方面,oppenheimer 正在南加州大學攻讀人工智能博士學位的大學好友 kenny daniel 卻有另一種苦衷:盡管自己已經發表了多個深受學術界歡迎的算法,但這些算法卻沒什麼機會應用到實際中。是以兩人一拍即合,決定搭檔解決雙方的共同問題。組建一個算法的“應用商店”—algorithmia。
其想法是讓算法發明者有機會将自己的工作運用到實際環境中,并且拿到錢,同時也能讓其他沒有微軟、google 那麼多資源的公司更容易進入算法開發的世界裡,為自己的問題找到最佳解決方案。
目前,此前已經有一些算法市場了,比方說提供廣告投放算法的dataxu,專門賣預制預測模型的snapanalytics,以及專注于機器學習算法的algorithms.io。但algorithmia的不同之處在于它接受并銷售所有類型的算法。另一個就是而stephen wolfram鼎鼎大名的mathematica online,這個雲服務版的數學軟體也內建了許多算法,不過它更多的是自行開發的算法。
機制
算法也能賣嗎?這個東西如何避免被複制?
建立一個算法市場并非易事。實際上,哪怕你在學術論文上能找到想用的算法,但是算法的實作往往很難。而且授權算法給使用者使用也是個問題。
algorithmia 靠雲服務解決這兩個問題。一旦使用者找到想用的算法,隻需添加幾行簡單的算法查詢代碼到應用中,algorithmia 的伺服器就會引導應用查詢給算法實作,傳回結果,進而避免了要把內建算法進應用的需要。查詢的成本則要看算法作者的定價。
此外,算法作者也可以選擇将自己的算法開源,這樣開發者就可以直接把算法內建到自己的應用中,不過 algorithmia 希望雲服務的便利性能更令其值得使用者付錢。不過這麼做的缺點是使用者必須把資料發送給 algorithmia 的伺服器進行處理。是以這一方面會有資料暴露的隐患,另外就是資料量大的話可能會有性能的問題。
algorithmia 的做法是向若幹雲服務提供商要資源,比方說 amazon、rackspace 等,這樣可以保證大部分使用者的性能。此外,他們也計劃向一些有資料中心的公司提供本地版。
算法的yelp
分析顧問兼教育訓練師 ajay ohri 期待類似的東西已有多年。現在很多移動應用的開發者都可以通過應用商店賺到大錢,但是盡管算法的開發困難且有些十分有用,但算法開發者卻很難賺錢。是以他一直希望有個地方也能讓這群人賺錢,哪怕隻有應用開發者的一點點也好。
但是鑒于 algorithmia 仍處于私測階段,這個服務是否就是他期待的解決方案尚不得而知。他的希望是 algorithmia 能發展成像點評網站 yelp 那樣變成算法的點評網站。其觀點是幫助開發者選擇最好的算法甚至比市場元件本身還要重要,因為最适合應用的算法的确定是非常困難的。而 algorithmia 的确有類似應用商店的評級和評論功能。
原文釋出時間為:2014-08-18
本文來自雲栖社群合作夥伴“大資料文摘”,了解相關資訊可以關注“bigdatadigest”微信公衆号