- 原文連結
- FM\\FMM優點:特征稀疏時保持良好性能
- FM原理:
- onehot的編碼後特征極度稀疏,特征空間大(升維雙刃劍:線性可分、過拟合次元爆炸--效果為王)
- 通過多項式交叉後,交叉特征含有更多的特征值為零樣本。但是為了訓練權重,讓不同的特征權重區分化更多的依賴于該特征下非零的樣本
- 采用一種矩陣分解的思路。求得的n*k維矩陣v為描述特征的因子
- 優點:訓練的參數變少了;對于vi,可以通過任意一個vj來求,很大程度上避免了資料稀疏性
- 總結:複雜度線性/樣本稀疏的情況下有優勢
- FFM原理
- field概念:将同種性質的特征都歸為同一個field
- 将每一個vi按照field拆分為不同的向量。這樣符合不同特征間的内在差異