部分依賴圖(以下簡稱PDP)顯示了目标響應[1]和一組“目标”特征之間的依賴關系,并邊緣化所有其他特征(特征補集,是目标特征集關于全部特征集合的補集)的值。直覺地,我們可以将部分依賴關系解釋為預期目标響應作為“目标”特征的函數。
由于人類感覺的限制,目标特征集的大小必須很小(通常是一個或兩個),是以目标特征通常需要從最重要的特征中選擇。
下圖展示了使用GradientBoostingRegressor實作的,加利福尼亞州住房資料集的四個單向和一個雙向PDP:
單向PDP告訴我們目标響應和目标特征(如線性、非線性)之間的互相作用。上圖左上方的圖表顯示了一個地區的收入中位數對房價中位數的影響;我們可以清楚地看到它們之間的線性關系。注意,PDP假設目标特征獨立于補體特征,而這一假設在實踐中經常被推翻。
from sklearn.datasets import make_hastie_10_2
from sklearn.ensemble import GradientBoostingClassifier
from sklearn.inspection import plot_partial_dependenceX, y = make_hastie_10_2(random_state=0)
clf = GradientBoostingClassifier(n_estimators=100, learning_rate=1.0,
… max_depth=1, random_state=0).fit(X, y)features = [0, 1, (0, 1)]
plot_partial_dependence(clf, X, features)