機器學習的一般過程
資料處理
1.資料收集 (資料檢索、資料挖掘、爬蟲)
2.資料清洗
機器學習
1.選擇模型 (算法)
2.訓練模型 (算法)
3.評估模型 (工具、架構、算法知識)
4.測試模型
業務運維
1.應用模型
2.維護模型
機器學習的基本問題
1.回歸問題:根據已知的輸入和輸出尋找某種性能最佳的模型,将未知輸出的輸入代入模型,得到連續的輸出。
2.分類問題:根據已知的輸入和輸出尋找某種性能最佳的模型,将未知輸出的輸入代入模型,得到離散的輸出。
3.聚類問題:根據已知輸入的相似程度,将其劃分為不同的群落。
4.降維問題:在性能損失盡可能小的前提下,降低資料的複雜度。