天天看點

機器學習常用目标函數、評價名額、Cost function等模型評估方法及sklearn實踐整理中。。。模型評估:量化模型預測品質

整理中。。。

模型評估:量化模型預測品質

有3種不同的API用于評估模型預測的品質:

Estimator評分方法:Estimators有一種score方法可以為他們設計要解決的問題提供預設評估标準。本頁未對此進行讨論,但在每個估算工具的文檔中都有讨論。

評分參數:使用交叉驗證(例如 model_selection.cross_val_score和 model_selection.GridSearchCV)的模型評估工具 依賴于内部評分政策。這将在評分參數:定義模型評估規則一節中讨論。

度量功能:該metrics子產品實作了針對特定目的評估預測誤差的功能。這些名額詳細介紹了分類名額, 多标簽排名名額,回歸名額和 群集名額。

最後,虛拟估計器可用于獲得随機預測的那些度量的基線值。

回歸模型的評價名額

sklearn.metrics子產品實作目标函數、評價名額、Cost function及來衡量回歸性能。他們有些已得到增強,以處理多輸出的情況下:mean_squared_error, mean_absolute_error,explained_variance_score和 r2_score。

這些函數有一個multioutput關鍵字參數,用于指定每個目标的得分或損失的平均值。預設值為’uniform_average’,指定輸出的均勻權重平均值。如果傳遞了一個ndarray形狀(n_outputs,),則其條目将被解釋為權重,并傳回相應的權重平均值。如果multioutputIS 'raw_values’被指定,則所有未改變的個人得分或損失将在形狀的陣列傳回 (n_outputs,)。

在r2_score和explained_variance_score接受附加價值’variance_weighted’的multioutput參數。該選項導緻通過相應目标變量的方差對每個單獨分數進行權重。此設定量化全局捕獲的未縮放方差。如果目标變量具有不同的比例,則該分數更重要的是很好地解釋較高的方差變量。 multioutput='variance_weighted’是r2_score 向後相容性的預設值。