我幫助初學者開始機器學習。但一次又一次地在心态和行動上看到同樣的錯誤。
在這篇文章中,您将發現我認為初學者在開始機器學習時出現失誤的 5 種最常見方式。
我堅信,任何人都可以開始,使用應用機器學習并做得很好。希望您能在下面的一個或多個陷阱中認出自己,并采取一些糾正措施以重回正軌。

傳統的機器學習教學方法是自下而上的。
努力學習數學背景。
努力學習機器學習的理論。
努力從頭開始實作算法。
迷茫階段。
最後開始使用機器學習(你的目标!)。
這種方法很慢而且很難(專為想要擴充最新技術的學者而設計,不是為想要結果的從業者設計的)
陷阱
如果您想或說出以下内容,您就知道自己陷入了這個陷阱:
我需要先完成這門線性代數課程。
我需要回去攻讀博士學位。第一的。
我必須先閱讀這本教科書。
建議
學習 4 年的數學或深奧的算法理論如何讓你到達你想要的目标?你更有可能停下來,失敗。
解決方法是翻轉模型。
如果機器學習對市場的寶貴貢獻是一組準确的預測,那麼學習如何對問題模組化并做出準确的預測。從這裡開始。
然後真的擅長運用它。
如果需要,請閱讀、竊取、利用理論,但僅限于為您的目标服務。隻有當它讓你更好地傳遞價值時。
機器學習是一個非常大的研究領域。
它是計算機學習過程的自動化,與人工智能有很深的重疊。
從深奧的學習理論到機器人技術。該領域是巨大的。
這個領域太大了,你無法承擔所有。
如果您有以下想法,您就知道自己已經屈服于這個陷阱:
我需要了解新網站上提到的每一項新技術。
我需要先學習計算機視覺、自然語言處理、語音等。
我需要知道一切。
選擇一個小角落并專注于它。然後再次縮小範圍。
機器學習最有價值的領域是預測模組化。從資料建立模型以進行預測。
接下來,專注于一種與您最相關或最有趣的預測模組化。
然後堅持下去。
也許你是通過技術來選擇的,比如深度學習。或者您可以按問題類型進行選擇,例如推薦系統。
也許你不确定,是以随便選一個。變得優秀或至少精通。
然後,稍後,繞回另一個區域。
機器學習實際上是關于算法的。
有很多算法。每個算法都是一個複雜的系統,它有自己的小研究領域。它有自己的生态系統。
迷失在算法中的人稱之為學者,這個并不是大衆的目标。
如果您發現自己說:
在我使用它之前,我需要知道它為什麼有效。
我需要先深入了解超參數。
我需要在調整時解釋原因和結果。
算法不是結果。它們是達到結果的手段。
事實上,機器學習算法是一種商品。
把它們換掉。針對你的問題嘗試大量的方法。對它們進行一些調整,但繼續前進。
您可以了解有關算法的更多資訊以獲得更好的結果,但要知道何時停止。
使用系統的過程。設計調優實驗并自動執行和分析。
機器學習是關于算法的良好使用,但應用機器學習不僅僅是擺弄算法。
專注于從每個項目傳遞結果的目标,即一組預測或可以實作它們的模型。
您可以從從頭開始實作算法中學到很多東西。
有時您甚至需要實作一種技術,因為沒有合适或可用的實作。
但是,通常情況下,您不必也不應該這樣做。
如果出現以下情況,您就會陷入這個陷阱:
您正在編寫代碼來加載 csv 檔案(到底是什麼!?)
您正在為線性回歸等标準算法編寫代碼。
您正在編寫用于交叉驗證或超參數調整的代碼。
停下來。
使用由數以萬計或數十萬其他開發人員使用的通用庫,該庫處理所有邊緣情況并且已知是正确的。 使用高度優化的庫,從硬體中壓縮每個最後一個周期和每個最後一個位元組的記憶體。 為您自己的項目使用圖形使用者界面,并完全避免代碼。 每次你想使用它時都實作它是機器學習入門的一種非常緩慢的方式。
如果您是為了學習而實施,那麼對自己誠實,并将其與學習如何通過應用機器學習傳遞價值分開。
有很多很棒的機器學習工具。
事實上,出色的工具、資料可用性和快速的硬體是我們看到機器學習複興的原因。
但是,您可能會陷入跳到偶然發現的每個新工具的陷阱。
如果你發現自己,你就陷入了這個陷阱:
使用您聽說的每個新工具。
發現自己每周或每月都在學習一種新工具或語言。
學習一個圖書館并把它抛在後面去一個新的圖書館。
學習和使用新工具。
但要有戰略眼光。
将新工具內建到您解決機器學習問題的系統流程中。
如果您選擇大型主要平台之一并堅持使用它,您在解決問題時會更有效率,至少直到您熟練或精通它為止。
還有其他工具,如果這是您所在的領域,還有更多專業工具。
跟随别人的腳步是業餘愛好者和專業人士之間的差別。
#機器學習##資料分析##人工智能##工作方法#