天天看點

特征重要性之排列重要性Permutaion Importance

基于模型刷選特征方法有:排列重要性、shap value、null importance

這裡簡單介紹一下排列重要性:

首先建立一個模型,計算某列特征重要性時,打亂該列順序,其餘列不變,然後再使用打亂後的資料來預測,最後計算正确率;如果某列對模型預測很重要,那麼打亂該列順序之後,模型預測正确率就會很差,如果對預測結果沒有影響,則說明該變量對模型沒有那麼重要;為了消減随機對結果的影響,我們會多次亂打,再求均值和方差。

計算速度快

應用廣泛、易于了解

與我們期望一個特征重要性度量所具有的性質一緻

特征重要性之排列重要性Permutaion Importance
特征重要性之排列重要性Permutaion Importance

文章強調2點:(1)打亂順序;(2)使用準确率名額衡量