在推薦系統和計算廣告業務中，點選率CTR（click-through rate）和轉化率CVR（conversion rate）是衡量流量轉化的兩個關鍵名額。準确的估計CTR、CVR對于提高流量的價值，增加廣告及電商收入有重要的指導作用。業界常用的方法有人工特征工程 + LR（Logistic Regression）、GBDT（Gradient Boosting Decision Tree） + LR、FM模型。在這些模型中，FM近年來表現突出，分别在由Criteo和Avazu舉辦的CTR預測競賽中奪得冠軍。

因子分解機（Factorization Machine, FM）是由Steffen Rendle提出的一種基于矩陣分解的機器學習算法，其主要用于解決資料稀疏的業務場景（如推薦業務），特征怎樣組合的問題。

paper指出FM與SVM相比，有如下優勢：

FM可以實作非常稀疏資料參數估計，而SVM會效果很差，因為訓出的SVM模型會面臨較高的bias；
FMs擁有線性的複雜度, 可以通過 primal 來優化而不依賴于像SVM的支援向量機；

一、FM原理

1. 為什麼進行特征組合？

在feed流推薦場景中，根據user和item基礎資訊（clicked：是否點選；userId：使用者ID；userGender：使用者性别；itemTag：物品類别），來預測使用者是否對物品感興趣（點選與否，二分類問題）。源資料如下：

clicked	userId	userGender	itemTag
1	1	男	籃球
1	男	化妝品
2	女	籃球
1	2	女	化妝品

由于userGender和itemTag特征都是categorical類型的，需要經過獨熱編碼（One-Hot Encoding）轉換成數值型特征。

clicked	userId	userGender_男	userGender_女	itemTag_籃球	itemTag_化妝品
1	1	1	1
1	1	1
2	1	1
1	2	1	1

經過One-Hot編碼之後，大部分樣本資料特征是比較稀疏的。上面的樣例中，每個樣本有5維特征，但平均僅有3維特征具有非零值。實際上，這種情況并不是此例獨有的，在真實應用場景中這種情況普遍存在。例如，CTR/CVR預測時，使用者的性别、職業、教育水準、品類偏好，商品的品類等，經過One-Hot編碼轉換後都會導緻樣本資料的稀疏性。特别是商品品類這種類型的特征，如商品的三級品類約有1000個，采用One-Hot編碼生成1000個數值特征，但每個樣本的這1000個特征，有且僅有一個是有效的（非零）。由此可見，資料稀疏性是實際問題中不可避免的挑戰。

One-Hot編碼的另一個特點就是導緻特征空間大。例如，商品三級類目有1000維特征，一個categorical特征轉換為1000維數值特征，特征空間劇增。

同時通過觀察大量的樣本資料可以發現，某些特征經過關聯之後，與label之間的相關性就會提高。例如，“男性”與“籃球”、“女性”與“化妝品”這樣的關聯特征，對使用者的點選有着正向的影響。換句話說：男性使用者很可能會在籃球有大量的浏覽行為；而在化妝品卻不會有。這種關聯特征與label的正向相關性在實際問題中是普遍存在的。是以，引入兩個特征的組合是非常有意義的。

2. 如何組合特征？

多項式模型是包含特征組合的最直覺的模型。在多項式模型中，特征

推薦系統FM & FFM算法解讀與實踐一、FM原理二、FFM原理三、xlearn實作

和

推薦系統FM & FFM算法解讀與實踐一、FM原理二、FFM原理三、xlearn實作

的組合采用

推薦系統FM & FFM算法解讀與實踐一、FM原理二、FFM原理三、xlearn實作

表示，即

推薦系統FM & FFM算法解讀與實踐一、FM原理二、FFM原理三、xlearn實作

和

推薦系統FM & FFM算法解讀與實踐一、FM原理二、FFM原理三、xlearn實作

都非零時，組合特征

推薦系統FM & FFM算法解讀與實踐一、FM原理二、FFM原理三、xlearn實作

才有意義。從對比的角度，本文隻讨論二階多項式模型。模型的表達式如下：

推薦系統FM & FFM算法解讀與實踐一、FM原理二、FFM原理三、xlearn實作

其中，

推薦系統FM & FFM算法解讀與實踐一、FM原理二、FFM原理三、xlearn實作

代表樣本的特征數量，

推薦系統FM & FFM算法解讀與實踐一、FM原理二、FFM原理三、xlearn實作

是第

推薦系統FM & FFM算法解讀與實踐一、FM原理二、FFM原理三、xlearn實作

個特征的值，

推薦系統FM & FFM算法解讀與實踐一、FM原理二、FFM原理三、xlearn實作

是模型參數。

從公式來看，模型前半部分就是普通的LR線性組合，後半部分的交叉項即特征的組合。單從模型表達能力上來看，FM的表達能力是強于LR的，至少不會比LR弱，當交叉項參數全為0時退化為普通的LR模型。

從上面公式可以看出，組合特征的參數一共有

推薦系統FM & FFM算法解讀與實踐一、FM原理二、FFM原理三、xlearn實作

個，任意兩個參數都是獨立的。然而，在資料稀疏性普遍存在的實際應用場景中，二次項參數的訓練是很困難的。其原因是：每個參數

推薦系統FM & FFM算法解讀與實踐一、FM原理二、FFM原理三、xlearn實作

的訓練需要大量

推薦系統FM & FFM算法解讀與實踐一、FM原理二、FFM原理三、xlearn實作

和

推薦系統FM & FFM算法解讀與實踐一、FM原理二、FFM原理三、xlearn實作

都非零的樣本；由于樣本資料本來就比較稀疏，滿足

推薦系統FM & FFM算法解讀與實踐一、FM原理二、FFM原理三、xlearn實作

和

推薦系統FM & FFM算法解讀與實踐一、FM原理二、FFM原理三、xlearn實作

都非零的樣本将會非常少。訓練樣本的不足，很容易導緻參數

推薦系統FM & FFM算法解讀與實踐一、FM原理二、FFM原理三、xlearn實作

不準确，最終将嚴重影響模型的性能。

3. 如何解決二次項參數的訓練問題呢？

矩陣分解提供了一種解決思路。在model-based的協同過濾中，一個rating矩陣可以分解為user矩陣和item矩陣，每個user和item都可以采用一個隐向量表示。比如在下圖中的例子中，我們把每個user表示成一個二維向量，同時把每個item表示成一個二維向量，兩個向量的點積就是矩陣中user對item的打分。

推薦系統FM & FFM算法解讀與實踐一、FM原理二、FFM原理三、xlearn實作

任意的

推薦系統FM & FFM算法解讀與實踐一、FM原理二、FFM原理三、xlearn實作

實對稱矩陣都有

推薦系統FM & FFM算法解讀與實踐一、FM原理二、FFM原理三、xlearn實作

個線性無關的特征向量。并且這些特征向量都可以正交機關化而得到一組正交且模為1的向量。故實對稱矩陣

推薦系統FM & FFM算法解讀與實踐一、FM原理二、FFM原理三、xlearn實作

可被分解成：

推薦系統FM & FFM算法解讀與實踐一、FM原理二、FFM原理三、xlearn實作

其中

推薦系統FM & FFM算法解讀與實踐一、FM原理二、FFM原理三、xlearn實作

為正交矩陣，

推薦系統FM & FFM算法解讀與實踐一、FM原理二、FFM原理三、xlearn實作

為實對角矩陣。

類似地，所有二次項參數

推薦系統FM & FFM算法解讀與實踐一、FM原理二、FFM原理三、xlearn實作

可以組成一個對稱陣

推薦系統FM & FFM算法解讀與實踐一、FM原理二、FFM原理三、xlearn實作

（為了友善說明FM的由來，對角元素可以設定為正實數），那麼這個矩陣就可以分解為

推薦系統FM & FFM算法解讀與實踐一、FM原理二、FFM原理三、xlearn實作

，

推薦系統FM & FFM算法解讀與實踐一、FM原理二、FFM原理三、xlearn實作

的第

推薦系統FM & FFM算法解讀與實踐一、FM原理二、FFM原理三、xlearn實作

列(

推薦系統FM & FFM算法解讀與實踐一、FM原理二、FFM原理三、xlearn實作

)便是第

推薦系統FM & FFM算法解讀與實踐一、FM原理二、FFM原理三、xlearn實作

維特征(

推薦系統FM & FFM算法解讀與實踐一、FM原理二、FFM原理三、xlearn實作

)的隐向量。換句話說，特征分量

推薦系統FM & FFM算法解讀與實踐一、FM原理二、FFM原理三、xlearn實作

和

推薦系統FM & FFM算法解讀與實踐一、FM原理二、FFM原理三、xlearn實作

的交叉項系數就等于

推薦系統FM & FFM算法解讀與實踐一、FM原理二、FFM原理三、xlearn實作

對應的隐向量與

推薦系統FM & FFM算法解讀與實踐一、FM原理二、FFM原理三、xlearn實作

對應的隐向量的内積，即每個參數

推薦系統FM & FFM算法解讀與實踐一、FM原理二、FFM原理三、xlearn實作

，這就是FM模型的核心思想。

為了求出

推薦系統FM & FFM算法解讀與實踐一、FM原理二、FFM原理三、xlearn實作

，我們需要求出特征分量

推薦系統FM & FFM算法解讀與實踐一、FM原理二、FFM原理三、xlearn實作

的輔助向量

推薦系統FM & FFM算法解讀與實踐一、FM原理二、FFM原理三、xlearn實作

的輔助向量

推薦系統FM & FFM算法解讀與實踐一、FM原理二、FFM原理三、xlearn實作

表示隐向量長度（實際應用中

推薦系統FM & FFM算法解讀與實踐一、FM原理二、FFM原理三、xlearn實作

），轉換過程如下圖所示：

推薦系統FM & FFM算法解讀與實踐一、FM原理二、FFM原理三、xlearn實作

矩陣對角線上面的元素即為交叉項的參數。

FM的模型方程為（本文不讨論FM的高階形式）：

推薦系統FM & FFM算法解讀與實踐一、FM原理二、FFM原理三、xlearn實作

其中，

推薦系統FM & FFM算法解讀與實踐一、FM原理二、FFM原理三、xlearn實作

是第

推薦系統FM & FFM算法解讀與實踐一、FM原理二、FFM原理三、xlearn實作

維特征的隐向量，

推薦系統FM & FFM算法解讀與實踐一、FM原理二、FFM原理三、xlearn實作

代表向量點積。隐向量的長度為

推薦系統FM & FFM算法解讀與實踐一、FM原理二、FFM原理三、xlearn實作

，包含

推薦系統FM & FFM算法解讀與實踐一、FM原理二、FFM原理三、xlearn實作

個描述特征的因子。根據公式，二次項的參數數量減少為

推薦系統FM & FFM算法解讀與實踐一、FM原理二、FFM原理三、xlearn實作

個，遠少于多項式模型的參數數量。所有包含

推薦系統FM & FFM算法解讀與實踐一、FM原理二、FFM原理三、xlearn實作

的非零組合特征（存在某個

推薦系統FM & FFM算法解讀與實踐一、FM原理二、FFM原理三、xlearn實作

，使得

推薦系統FM & FFM算法解讀與實踐一、FM原理二、FFM原理三、xlearn實作

）的樣本都可以用來學習隐向量

推薦系統FM & FFM算法解讀與實踐一、FM原理二、FFM原理三、xlearn實作

，這很大程度上避免了資料稀疏性造成的影響。

顯而易見，上述是一個通用的拟合方程，可以采用不同的損失函數用于解決回歸、二進制分類等問題，比如可以采用MSE（Mean Square Error）損失函數來求解回歸問題，也可以采用Hinge/Cross-Entropy 損失來求解分類問題。當然，在進行二進制分類時，FM的輸出需要經過sigmoid變換，這與Logistic回歸是一樣的。直覺上看，FM的複雜度是

推薦系統FM & FFM算法解讀與實踐一、FM原理二、FFM原理三、xlearn實作

。但是，通過公式(3)的等式，FM的二次項可以化簡，其複雜度可以優化到

推薦系統FM & FFM算法解讀與實踐一、FM原理二、FFM原理三、xlearn實作

。由此可見，FM可以線上性時間對新樣本作出預測。

采用随機梯度下降法SGD求解參數

推薦系統FM & FFM算法解讀與實踐一、FM原理二、FFM原理三、xlearn實作

由上式可知，

推薦系統FM & FFM算法解讀與實踐一、FM原理二、FFM原理三、xlearn實作

的訓練隻需要樣本

推薦系統FM & FFM算法解讀與實踐一、FM原理二、FFM原理三、xlearn實作

的特征非0即可，适合于稀疏資料。

在使用SGD訓練模型時，在每次疊代中，隻需計算一次所有

推薦系統FM & FFM算法解讀與實踐一、FM原理二、FFM原理三、xlearn實作

的

推薦系統FM & FFM算法解讀與實踐一、FM原理二、FFM原理三、xlearn實作

，就能夠友善得到所有

推薦系統FM & FFM算法解讀與實踐一、FM原理二、FFM原理三、xlearn實作

的梯度，上述偏導結果求和公式中沒有

推薦系統FM & FFM算法解讀與實踐一、FM原理二、FFM原理三、xlearn實作

，即與

推薦系統FM & FFM算法解讀與實踐一、FM原理二、FFM原理三、xlearn實作

無關，隻與

推薦系統FM & FFM算法解讀與實踐一、FM原理二、FFM原理三、xlearn實作

有關，顯然計算所有

推薦系統FM & FFM算法解讀與實踐一、FM原理二、FFM原理三、xlearn實作

的

推薦系統FM & FFM算法解讀與實踐一、FM原理二、FFM原理三、xlearn實作

的複雜度是

推薦系統FM & FFM算法解讀與實踐一、FM原理二、FFM原理三、xlearn實作

，模型參數一共有

推薦系統FM & FFM算法解讀與實踐一、FM原理二、FFM原理三、xlearn實作

個。是以，FM參數訓練的複雜度也是

推薦系統FM & FFM算法解讀與實踐一、FM原理二、FFM原理三、xlearn實作

。綜上可知，FM可以線上性時間訓練和預測，是一種非常高效的模型。

二、FFM原理

1. 特征組合為什麼引入field？

同樣以feed流推薦場景為例，我們多引入user次元使用者年齡資訊，其中性别和年齡同屬于user次元特征，而tag屬于item次元特征。在FM原理講解中，“男性”與“籃球”、“男性”與“年齡”所起潛在作用是預設一樣的，但實際上不一定。FM算法無法捕捉這個差異，因為它不區分更廣泛類别field的概念，而會使用相同參數的點積來計算。

在FFM（Field-aware Factorization Machines ）中每一維特征（feature）都歸屬于一個特定和field，field和feature是一對多的關系。如下表所示：

field	user field(U)	item field(I)
clicked	userId	userGender_男	userGender_女	userAge_[20.30]	userAge_[30,40]	itemTag_籃球	itemTag_化妝品
1	1	1	1	1
1	1	1	1
2	1	1	1
1	2	1	1	1

FFM模型認為

推薦系統FM & FFM算法解讀與實踐一、FM原理二、FFM原理三、xlearn實作

不僅跟

推薦系統FM & FFM算法解讀與實踐一、FM原理二、FFM原理三、xlearn實作

有關系，還跟與

推薦系統FM & FFM算法解讀與實踐一、FM原理二、FFM原理三、xlearn實作

相乘的

推薦系統FM & FFM算法解讀與實踐一、FM原理二、FFM原理三、xlearn實作

所屬的Field有關系，即

推薦系統FM & FFM算法解讀與實踐一、FM原理二、FFM原理三、xlearn實作

成了一個二維向量

推薦系統FM & FFM算法解讀與實踐一、FM原理二、FFM原理三、xlearn實作

，

推薦系統FM & FFM算法解讀與實踐一、FM原理二、FFM原理三、xlearn實作

是隐向量長度，

推薦系統FM & FFM算法解讀與實踐一、FM原理二、FFM原理三、xlearn實作

是Field的總個數。設樣本一共有

推薦系統FM & FFM算法解讀與實踐一、FM原理二、FFM原理三、xlearn實作

個特征,

推薦系統FM & FFM算法解讀與實踐一、FM原理二、FFM原理三、xlearn實作

個field，那麼FFM的二次項有

推薦系統FM & FFM算法解讀與實踐一、FM原理二、FFM原理三、xlearn實作

個隐向量。而在FM模型中，每一維特征的隐向量隻有一個。FM可以看作FFM的特例，是把所有特征都歸屬到一個field時的FFM模型。

推薦系統FM & FFM算法解讀與實踐一、FM原理二、FFM原理三、xlearn實作

其中，

推薦系統FM & FFM算法解讀與實踐一、FM原理二、FFM原理三、xlearn實作

是第

推薦系統FM & FFM算法解讀與實踐一、FM原理二、FFM原理三、xlearn實作

的特征所屬的字段。如果隐向量的長度為

推薦系統FM & FFM算法解讀與實踐一、FM原理二、FFM原理三、xlearn實作

，那麼FFM的二次參數有

推薦系統FM & FFM算法解讀與實踐一、FM原理二、FFM原理三、xlearn實作

個，遠多于FM模型的

推薦系統FM & FFM算法解讀與實踐一、FM原理二、FFM原理三、xlearn實作

個。此外，由于隐向量與field相關，FFM二次項并不能夠化簡，時間複雜度是

推薦系統FM & FFM算法解讀與實踐一、FM原理二、FFM原理三、xlearn實作

。

需要注意的是由于FFM中的latent vector隻需要學習特定的field，是以通常：

推薦系統FM & FFM算法解讀與實踐一、FM原理二、FFM原理三、xlearn實作

2. 如何組合特征？

還是以feed流場景為例，說明FFM是如何組合特征的。輸入記錄如下：

clicked	userId	userGender(U)	userAge(U)	itemTag(I)
1	1	男	[20,30]	籃球

FM模型交叉項為：

推薦系統FM & FFM算法解讀與實踐一、FM原理二、FFM原理三、xlearn實作

而FFM模型特征交叉項為：

推薦系統FM & FFM算法解讀與實踐一、FM原理二、FFM原理三、xlearn實作

FFM在做latent vector的inner product的時候，必須考慮到其他特征所屬的字段。例如

推薦系統FM & FFM算法解讀與實踐一、FM原理二、FFM原理三、xlearn實作

中男性和年齡[20,30]均為user field，是以不區分field；

推薦系統FM & FFM算法解讀與實踐一、FM原理二、FFM原理三、xlearn實作

和

推薦系統FM & FFM算法解讀與實踐一、FM原理二、FFM原理三、xlearn實作

中男性、年齡[20,30]屬于user field，而籃球屬于item field，是以要考慮特征的latent vector。

三、xlearn實作

實作FM & FFM的最流行的python庫有：LibFM、LibFFM、xlearn和tffm。其中，xLearn是一款高性能，易于使用且可擴充的機器學習軟體包，包括FM和FFM模型，可用于大規模解決機器學習問題。xlearn比libfm和libffm庫快得多，并為模型測試和調優提供了更好的功能。這裡以xlearn實作FM和FFM算法。

1. FM實作

資料來自Kaggle預測泰坦尼克号的生存資料集，xlearn可以直接處理csv以及libsvm格式資料來實作FM算法，但對于FFM必須是libsvm格式資料。

1.1 python代碼

import xlearn as xl

# 訓練
fm_model = xl.create_fm()  # 使用xlearn自帶的FM模型
fm_model.setTrain("./fm_train.txt")  # 訓練資料

# 參數:
#  0. 二分類任務
#  1. learning rate: 0.2
#  2. lambda: 0.002
#  3. metric: accuracy
param = {'task':'binary', 'lr':0.2,
         'lambda':0.002, 'metric':'acc'}

# 使用交叉驗證
fm_model.cv(param)

1.2 運作

[ ACTION ] Start to train ...

[ ACTION ] Cross-validation: 1/3:

[------------] Epoch Train log_loss Test log_loss Test Accuarcy Time cost (sec)

[ 10% ] 1 0.520567 0.519509 0.770270 0.00

[ 20% ] 2 0.462764 0.504741 0.787162 0.00

[ 30% ] 3 0.451524 0.499556 0.790541 0.00

[ 40% ] 4 0.446151 0.497348 0.787162 0.00

[ 50% ] 5 0.443402 0.494840 0.793919 0.00

[ 60% ] 6 0.440488 0.494532 0.793919 0.00

[ 70% ] 7 0.439055 0.493156 0.804054 0.00

[ 80% ] 8 0.438151 0.493404 0.800676 0.00

[ 90% ] 9 0.437012 0.492352 0.807432 0.00

[ 100% ] 10 0.436463 0.492059 0.804054 0.00

[ ACTION ] Cross-validation: 2/3:

[------------] Epoch Train log_loss Test log_loss Test Accuarcy Time cost (sec)

[ 10% ] 1 0.529570 0.491618 0.798658 0.00

[ 20% ] 2 0.474390 0.477966 0.788591 0.00

[ 30% ] 3 0.461248 0.470482 0.785235 0.00

[ 40% ] 4 0.456666 0.469640 0.788591 0.00

[ 50% ] 5 0.452902 0.468955 0.788591 0.00

[ 60% ] 6 0.450912 0.467620 0.785235 0.00

[ 70% ] 7 0.449447 0.467692 0.785235 0.00

[ 80% ] 8 0.447781 0.466430 0.781879 0.01

[ 90% ] 9 0.447122 0.466931 0.785235 0.00

[ 100% ] 10 0.446272 0.466597 0.788591 0.00

[ ACTION ] Cross-validation: 3/3:

[------------] Epoch Train log_loss Test log_loss Test Accuarcy Time cost (sec)

[ 10% ] 1 0.544947 0.470564 0.781145 0.00

[ 20% ] 2 0.491881 0.448169 0.794613 0.00

[ 30% ] 3 0.479801 0.442210 0.794613 0.00

[ 40% ] 4 0.475032 0.438578 0.804714 0.00

[ 50% ] 5 0.472111 0.436720 0.808081 0.00

[ 60% ] 6 0.470067 0.435224 0.811448 0.00

[ 70% ] 7 0.468599 0.434378 0.811448 0.00

[ 80% ] 8 0.466845 0.434049 0.811448 0.00

[ 90% ] 9 0.466121 0.433529 0.811448 0.00

[ 100% ] 10 0.465646 0.433083 0.814815 0.00

[------------] Average log_loss: 0.463913

[------------] Average Accuarcy: 0.802486

[ ACTION ] Finish Cross-Validation

[ ACTION ] Clear the xLearn environment ...

[------------] Total time cost: 0.04 (sec)

2. FFM實作

資料來自Criteo點選率預測挑戰賽中CTR資料集的一個微小（1％）抽樣，首先我們需要将其轉換為xLearn所需的libffm格式以拟合模型。

2.1 python代碼

import xlearn as xl

# 訓練
ffm_model = xl.create_ffm() # 使用FFM模型
ffm_model.setTrain("./FFM_train.txt")  # 訓練資料
ffm_model.setValidate("./FFM_test.txt")  # 校驗測試資料

# param:
#  0. binary classification
#  1. learning rate: 0.2
#  2. regular lambda: 0.002
#  3. evaluation metric: accuracy
param = {'task':'binary', 'lr':0.2,
         'lambda':0.002, 'metric':'acc'}

# 開始訓練
ffm_model.fit(param, './model.out')

# 預測
ffm_model.setTest("./FFM_test.txt")  # 測試資料
ffm_model.setSigmoid()  # 歸一化[0,1]之間

# 開始預測
ffm_model.predict("./model.out", "./output.txt")

2.2 運作

[ ACTION ] Initialize model ...

[------------] Model size: 5.56 MB

[------------] Time cost for model initial: 0.01 (sec)

[ ACTION ] Start to train ...

[------------] Epoch Train log_loss Test log_loss Test Accuarcy Time cost (sec)

[ 10% ] 1 0.600614 0.534322 0.770000 0.00

[ 20% ] 2 0.541555 0.536250 0.770000 0.00

[ 30% ] 3 0.521822 0.530098 0.770000 0.00

[ 40% ] 4 0.505286 0.537378 0.770000 0.00

[ 50% ] 5 0.492967 0.528159 0.770000 0.00

[ 60% ] 6 0.483819 0.533365 0.775000 0.00

[ 70% ] 7 0.472950 0.537750 0.770000 0.00

[ 80% ] 8 0.465698 0.531461 0.775000 0.00

[ 90% ] 9 0.457841 0.531676 0.770000 0.00

[ 100% ] 10 0.450092 0.531530 0.770000 0.00

[ ACTION ] Early-stopping at epoch 8, best Accuarcy: 0.775000

[ ACTION ] Start to save model ...

[------------] Model file: ./model.out

[------------] Time cost for saving model: 0.00 (sec)

[ ACTION ] Finish training

[ ACTION ] Clear the xLearn environment ...

[------------] Total time cost: 0.05 (sec)

----------------------------------------------------------------------------------------------

_

| |

__ _| | ___ __ _ _ __ _ __

\ \/ / | / _ \/ _` | '__| '_ \

> <| |___| __/ (_| | | | | | |

/_/\_\_____/\___|\__,_|_| |_| |_|

xLearn -- 0.36 Version --

----------------------------------------------------------------------------------------------

[------------] xLearn uses 4 threads for prediction task.

[ ACTION ] Load model ...

[------------] Load model from ./model.out

[------------] Loss function: cross-entropy

[------------] Score function: ffm

[------------] Number of Feature: 9991

[------------] Number of K: 4

[------------] Number of field: 18

[------------] Time cost for loading model: 0.00 (sec)

[ ACTION ] Read Problem ...

[------------] First check if the text file has been already converted to binary format.

[------------] Binary file (./FFM_test.txt.bin) found. Skip converting text to binary.

[------------] Time cost for reading problem: 0.00 (sec)

[ ACTION ] Start to predict ...

[------------] The test loss is: 0.531461

[ ACTION ] Clear the xLearn environment ...

[------------] Total time cost: 0.00 (sec)

參考資料

https://zhuanlan.zhihu.com/p/37963267

https://blog.csdn.net/hiwallace/article/details/81333604

https://blog.csdn.net/john_xyz/article/details/78933253

https://blog.csdn.net/tmb8z9vdm66wh68vx1/article/details/79091671

推薦系統FM & FFM算法解讀與實踐一、FM原理二、FFM原理三、xlearn實作

一、FM原理

1. 為什麼進行特征組合？

2. 如何組合特征？

3. 如何解決二次項參數的訓練問題呢？

二、FFM原理

1. 特征組合為什麼引入field？

2. 如何組合特征？

三、xlearn實作

1. FM實作

1.1 python代碼

1.2 運作

2. FFM實作

2.1 python代碼

2.2 運作

繼續閱讀

推薦系統-資源整理一、綜合性文章四、算法詳解：

深度學習推薦系統-筆記08：傳統推薦算法發展彙總

因子分解機FM算法原理

交叉特征的處理算法學習了解(FM-xDeepFM)FM算法FFM算法DeepFM算法DCN算法(Deep & cross network)xDeepFM算法

FM算法為什麼适用于稀疏資料

符合泊松分布的事件模拟到達時間生成符合泊松分布的事件模拟到達時間生成

相隔為1的編輯距離

Algorithms Review: Divide and Conquer(Binary Search & Merge Sort)

watermark performance standard &amp; algorithms

Visual Tracking 和 Motion Estimation的差別

[zz]The Most Important Algorithms (in CS and Math)

High-level Synthesis from AutoESL: A Game-changer for Chip Design

采用ODC改善軟體品質：一個案例研究

各種二分查找

查找算法學習之二分查找（Python版本）——BinarySearch

一道某高大上網際網路公司的筆試題分享

推薦系統FM &amp; FFM算法解讀與實踐一、FM原理二、FFM原理三、xlearn實作

一、FM原理

1. 為什麼進行特征組合？

2. 如何組合特征？

3. 如何解決二次項參數的訓練問題呢？

二、FFM原理

1. 特征組合為什麼引入field？

2. 如何組合特征？

三、xlearn實作

1. FM實作

1.1 python代碼

1.2 運作

2. FFM實作

2.1 python代碼

2.2 運作

繼續閱讀

推薦系統FM & FFM算法解讀與實踐一、FM原理二、FFM原理三、xlearn實作