天天看點

機器學習——第一章筆記

模式識别的基本概念

  • 模式識别:根據已有知識的表達,針對待識别模式,判别決策其所屬的類别或者預測其對應的回歸值。模式識别本質上是推理的過程。
    機器學習——第一章筆記
  • 數學表達:模式識别可以看做一種函數映射f(x),将待識别模式x從輸入空間映射到輸出空間。函數F(x)是關于已有知識的表達。
  • 模型:已有知識的表達式y=f(x)。
  • 模型的組成:特征提取+回歸器
  • 特征: 用于區分不同類别的、可觀測的量,具有辨識能力和魯棒性。

機器學習的基本概念

機器學習使用訓練樣本學習模型的參數和結構。模型結構分為線性結構和非線性結構。機器學習分為,無監督、半監督、監督式學習三種。

機器學習——第一章筆記

模型泛化能力

  • 泛化能力指的是器學習方法訓練出來一個模型,對于已知的資料(訓練集)性能表現良好,對于未知的資料(測試集)也應該表現良好的機器能力。泛化能力低會導緻過拟合,即在訓練階段表現良好在測試階段表現很差。是以不要過度訓練,或者引入正則項。

評估方法與性能名額

  • 評估方法:留出法,K折交叉驗證,留一驗證。
  • 性能名額:準确度:将陽性和陰性綜合起來度量識别正确的程度。精度:預測為陽性樣本的準确程度。召回率:全部陽性樣本中被預測為陽性的比例。