即使是最敏銳的技術布道師也無法預測大資料對數字革命的影響。因為他們最初的關注點都聚焦在了擴大基礎設施以建構現有服務上。
在提高對現有資料的處理能力時,許多的新技術被提出。關于機器學習的概念最早誕生于科幻小說中,它的新功能很快被人們發現并應用,但随之而來的是無法避免的局限性。
當資料被恰當地概念化時,複雜的AI算法可以做出最細緻巧妙的洞察。一個能夠通路正确資料的算法看上去是無所不知的。但事實上,在真實環境中的輸出并不總能輕松為這些算法依賴的資料類型所處理。
機器學習的核心是資料。遺憾的是,一些定性資料并不容易被轉換成可用格式。相比于被寄希望取代人類的AI算法,能夠了解不易分解的變量間的細微差别是我們自身的優勢。而為我們所稱贊的人工智能尚未掌握這一概念。
驅動人工智能的二進制語言自最初設想以來已有半個多世紀沒有發生變化,并且在未來也不可能很快發生改變。這意味着所有機器學習都必須以數字輸入為中心。
AI如何掌握聲學、光波和其他現實應用中的細微差異呢?有關這些系統的資訊必須經過處理并轉換為二進制語言。這不是不可能的,但有幾件事情必須完成:
系統工程師必須開發出精确的系統來測量這些輸入。這對于某些應用來說可能非常困難。通過分辨顔色的微小差異,人類可以輕松觀察到光波之間的差異。但對于AI來說,通過光學傳感器以足夠的精度發現差異并傳達是一件非常困難的任務。
這些輸入必須被分解并翻譯為二進制代碼。
必須對AI進行程式設計以了解并響應這些輸入。
123FormBuilder的創始人指出,當資料科學家需要模拟人類行為時,這可能極具挑戰性。同時,這是監控線上參與的關鍵。
“量化人類行為非常複雜,尤其是因為不同的人口統計資料反應不同。由于原始的機器學習算法的缺陷,處理來自熱力圖和其他報告的輸入是一項具有挑戰性的任務。“
機器學習必須在此之前得到發展。深度特征融合是一項可以克服這些障礙新技術,它為新的機器學習打開了複習的大門。
深度特征融合是一種新的解決方案,可以處理複雜的資料并将其分解為數字元件。2014年,兩位麻省理工學院的工程師開發了深度特征融合。然而直到最近,這項技術還處于起步階段,資料科學家才開始研究其在機器學習中的應用。
Donnelly表示,機器學習算法必須克服的最大技術障礙是依賴于處理資料才能工作。他們隻能根據資料做出預測,而這些資料由相關變量組成,稱為”特征“。如果計算的特征不能清晰地顯示預測的信号,那麼偏置就不會将模型帶到下一個層次。提取這些數字特征的過程稱為“特征工程”。
深度特征合成的關鍵優勢:
單個資料集中資料點之間的關系可以推斷出重要的特征
資料可以很容易地在不同的資料集之間合成
識别不同個體之間的關系可以幫助獲得新特征
<a href="https://promotion.aliyun.com/ntms/act/ambassador/sharetouser.html?userCode=j4nkrg1c&utm_source=j4nkrg1c" target="_blank"><b>數十款阿裡雲産品限時折扣中,趕緊點選領劵開始雲上實踐吧!</b></a>
以上為全部譯文
Ryan Kh, Octocs科技首席執行官
文章原标題Deep Feature Synthesis Is the Future of Machine Learning,譯者:Anchor C.,審閱:虎說八道。