【業界】開源大勢降低技術門檻，人工智能企業更依賴大資料

美國巴布森學院（babson college）管理與資訊科學學院的教授，mit 院士，德勤資深研究員thomas h. davenport 最近有一個新發現：并不是所有想要使用人工智能的企業都會跟提供技術的公司合作。

為什麼，因為有免費的開源算法可用。

靠銷售ai軟體來賺錢變得越來越難

thomas以一家向他咨詢的出版公司為例，這家公司希望能在産品的資料化和情景化中使用人工智能技術，但是，跟其他紛紛與ibm watson合作的競争對手不一樣，這家出版公司并沒有打算從ibm購買認知技術。

他們說：“我們認為ai軟體的市場是迅速商品化的，我們能夠以更低的成本來獲得所需要的（ai）能力”。

這家出版公司幾位經驗豐富的經理還提到，他們認為可以利用開源的人工智能軟體來降低成本，現在可以選擇的有好幾種。另外，很多開放資源提供者并不是小企業，它們可都是谷歌、facebook、微軟和亞馬遜這樣的巨頭。

thomas說：“剛聽到這樣的觀點時，我略微有一點意外。智能技術現在難道已經那麼便宜，那麼開放了嗎？”

在一個已經變得相對更新的市場上，所謂的認知軟體市場要怎樣進行商品化？為什麼深度學習和機器學習的開發者會進行開源？如果真的比不上免費的軟體，watson為什麼可以為ibm帶來100億以上的收入。

首先，從為什麼ai技術，也就是上文所說的認知技術為何會商品化這一方面，可以得到一些啟示。

現在，軟體開發中有一股強大的趨勢——在向“微服務”發展，這種“微服務”在小型的功能塊上處理運算，然後得到結果。這和傳統的“api”或者應用程式互動界面的工作方式一樣。由于這些都是小型的功能子產品，比起大型的軟體單元，企業更難為此付費。因為都是小型的和子產品化的，是以這些企業會租用多個軟體開發者開發的東西，而不是直接從大企業購買。

這幾乎就是認知軟體領域過去10多年所發生的事。現在開源庫很多，其中不乏一些擁有通用認知功能的算法，比如神經網絡、深度學習、語音解析和識别、圖像識别等等。

一些庫已經開源好幾年了，谷歌、微軟、facebook和亞馬遜都是最近一兩年才開源。通常，通過這些開源庫供應商的雲平台，可以使用這些開源工具（這樣一來，開源的公司至少還可以掙一點錢）。還有另一種方法，就是通過程式設計網站，比如github來使用這些開源庫。

理想的情況是，如果多家公司和大量的程式員都在使用某一家公司的開放資源認知工具，那麼很有可能，軟體将會變得标準化，另外，把這些工具嵌入到公司的其他産品中，也會變得更容易一些。

即便是為 ibm 帶來豐厚收入的watson也在走開源的道路。據統計，在watson 開發者雲上，現在有近20個api是可用的。另外，這個數字是不斷變化的，因為會不斷增加新的api、測試版會下架以及相關的api可能會被整合。

thomas說，考慮到認知工具商品化的速度非常快，不久後，更多watson的api進一步開源的話，我一點也不會覺得驚訝。

另一個驅動商品化的因素是“bots”，也叫智能人機互動api，或聊天機器人，它通過文本或者聲音的輸入，允許人和程式間進行對話式的交流。bot想要成功的話，首先要把語音轉化成文本，然後分析分本，了解其含義。這聽起來似乎很難，但是許多同類的公司已經釋出了自己的bot ai軟體開放資源，并把bot加入到了自己程式的互動中。很快，這一技術就會變得很普遍。由于bot隻是一個互動界面，一種像打字或者點選一樣的東西，隻不過更加容易一些罷了，是以沒人會願意在這個技術上花太多的錢。

以上這一切意味着，靠銷售ai軟體來賺錢會變得越來越難。當然，對于沒有資料科學家的公司來說，會需要許多外部的建議。公司也需要去研究在自己的業務中哪些部分使用這些工具比較好。

thomas說，我認為，會有一些高度定制化的ai解決方案，它們會是非常詳細和具體的，并且通過開放資源就能擷取。比如，能探測到欺詐的圖像分析系統。

但是，總體上，擁有ai技術的軟體會越來越多，而且都是免費的。如果你的公司知道做什麼，怎麼使用，或者怎樣把其加入你的業務中，你就能掙錢。如果隻是打算賣ai軟體，收益可能就不會那麼好了。

技術門檻降低，資料門檻變高

雖然算法的開源降低了技術門檻，但是在智能産品的開發中，隻有算法是遠遠不夠的。《财富》網站在7月11日一篇名為《為什麼說資料是原油？》的報道中提到，隻有擁有了資料，人工智能才會騰飛。

風險投資公司bloomberg beta的合夥人shivon zilis在評價的資料的價值時說：“資料是新的原油”。她認為，雖然谷歌、facebook和亞馬遜對人工智能軟體進行了開源，任何工程師都可以獲得代碼并開發新的應用程式，但是，大公司并不會公開必需的資料。

談到大公司開源軟體的原因，她認為，這些公司正在通過開放ai軟體工具包來招納更多的人才。是以，如果真的要競争，公司擁有的資料實際上比開源的軟體更加重要。

ibm watson 資料處理服務部門的總經理david keeny說：“資料會成為主流。此外，現在全世界的資料，隻有20%在網際網路上，剩下的80%都被各大公司群組織占據。”

談到資料，希望在産品中加入人工智能技術的公司又分為兩種，一種是有資料的，另一種是無資料的。有資料的是那些長久以來注重收集資料的老牌公司，比如醫院；沒有資料的通常是許多初創企業。

有資料的公司在智能化的道路上要走得容易一些，以自己手上的資料為資本，他們可以輕松地與擁有強大算法計算的公司達成合作，這種模式最典型的便是deepmind與英國全民醫療體系（nhs）的合作，兩家機構最新的技術成果是使用計算機視覺來診斷眼疾。

沒有資料的初創企業也存在機會，那便是在“無資料問題”的環境，比如日程安排這些還沒有公司取得巨大進展的問題處理上。

國外媒體verge報道說，像x.ai這樣的初創企業并沒有谷歌在gmail上累積的海量資料，但也開發出了智能化的日程安排軟體，并獲得商業的成功。通過這一案例，verge認為，初創企業可以聚焦于特别小的領域，比如x.ai關注日程安排的智能化。這是一個沒有資料的人工智能企業取得突破的途徑。

【業界】開源大勢降低技術門檻，人工智能企業更依賴大資料

繼續閱讀

MapReduce的幾個企業級經典面試案例MapReduce的幾個企業級經典面試案例

[HTML5]自定義屬性 data-* 和 jQuery.data 詳解

9.spark Core 進階2--Cashe

2021-2025年中國運動療法（KT）帶行業市場供需與戰略研究報告

C++ 第十五周報告1--《冒泡法排序》

2021年危險化學品經營機關安全管理人員考試題庫及危險化學品經營機關安全管理人員考試技巧

淺談企業活動中進行資料分析的重要性

筆試面試題目：滑動視窗(二)

資料結構與算法（27）——排序（二）

無人機--飛控科普

Dijkstra--簡易版（最短路徑）

Ambari介紹和架構原理

GitHub連夜封殺！這份阿裡 10W 字内部 Java 字面試手冊到底有多強？

NOSQL安全攻擊

win10本地scala和spark安裝安裝scala安裝spark

hdu7108哈希