天天看點

FM/FMM算法筆記

  1. 原文連結
  2. FM\\FMM優點:特征稀疏時保持良好性能
  3. FM原理:
    1. onehot的編碼後特征極度稀疏,特征空間大(升維雙刃劍:線性可分、過拟合次元爆炸--效果為王)
    2. 通過多項式交叉後,交叉特征含有更多的特征值為零樣本。但是為了訓練權重,讓不同的特征權重區分化更多的依賴于該特征下非零的樣本
    3. 采用一種矩陣分解的思路。求得的n*k維矩陣v為描述特征的因子
    4. 優點:訓練的參數變少了;對于vi,可以通過任意一個vj來求,很大程度上避免了資料稀疏性
    5. 總結:複雜度線性/樣本稀疏的情況下有優勢
  4. FFM原理
    1. field概念:将同種性質的特征都歸為同一個field
    2. 将每一個vi按照field拆分為不同的向量。這樣符合不同特征間的内在差異

繼續閱讀