天天看点

ML之PDP:基于titanic泰坦尼克是否获救二分类预测数据集利用PDP部分依赖图对RF随机森林和LightGBM模型实现可解释性案例

ML之PDP:基于titanic泰坦尼克是否获救二分类预测数据集利用PDP部分依赖图对RF随机森林和LightGBM模型实现可解释性案例

目录

​​基于titanic泰坦尼克是否获救二分类预测数据集利用PDP部分依赖图对RF随机森林和LightGBM模型实现可解释性案例​​

​​# 1、定义数据集​​

​​# 2、数据预处理​​

​​# 2.1、类别特征编码​​

​​# 2.2、特征筛选且空值填充​​

​​# 3、模型训练与推理​​

​​# 3.1、数据集切分​​

​​# 3.2、模型训练​​

​​# 4、PDP实现模型可解释性​​

​​4.1、Sex_encoding可视化​​

​​# (1)、绘制不同特征值(特征网格)的平均目标值:检查特征和目标之间的信息​​

​​# (2)、绘制跨不同特征值(特征网格)的模型预测分布​​

​​# (3)、计算并绘制PDP图解释模型预测​​

​​4.2、Pclass可视化​​

相关文章

ML之PDP:基于titanic泰坦尼克是否获救二分类预测数据集利用PDP部分依赖图对RF随机森林和LightGBM模型实现可解释性案例

ML之PDP:基于titanic泰坦尼克是否获救二分类预测数据集利用PDP部分依赖图对RF随机森林和LightGBM模型实现可解释性案例实现

基于titanic泰坦尼克是否获救二分类预测数据集利用PDP部分依赖图对RF随机森林和LightGBM模型实现可解释性案例

# 1、定义数据集

PassengerId Survived Pclass Name Sex Age SibSp Parch Ticket Fare Cabin Embarked
1 3 Braund, Mr. Owen Harris male 22 1 A/5 21171 7.25 S
2 1 1 Cumings, Mrs. John Bradley (Florence Briggs Thayer) female 38 1 PC 17599 71.2833 C85 C
3 1 3 Heikkinen, Miss. Laina female 26 STON/O2. 3101282 7.925 S
4 1 1 Futrelle, Mrs. Jacques Heath (Lily May Peel) female 35 1 113803 53.1 C123 S
5 3 Allen, Mr. William Henry male 35 373450 8.05 S

# 2、数据预处理

# 2.1、类别特征编码

# 2.2、特征筛选且空值填充

   Pclass   Age  SibSp  Parch     Fare  Sex_encoding  Embarked_encoding  \

0       3  22.0      1      0   7.2500             1                  0   

1       1  38.0      1      0  71.2833             0                  1   

2       3  26.0      0      0   7.9250             0                  0   

3       1  35.0      1      0  53.1000             0                  0   

4       3  35.0      0      0   8.0500             1                  0   

   Survived  

0         0  

1         1  

2         1  

3         1  

4         0  

# 3、模型训练与推理

# 3.1、数据集切分

# 3.2、模型训练

# 4、PDP实现模型可解释性

4.1、Sex_encoding可视化

# (1)、绘制不同特征值(特征网格)的平均目标值:检查特征和目标之间的信息

ML之PDP:基于titanic泰坦尼克是否获救二分类预测数据集利用PDP部分依赖图对RF随机森林和LightGBM模型实现可解释性案例

# (2)、绘制跨不同特征值(特征网格)的模型预测分布

ML之PDP:基于titanic泰坦尼克是否获救二分类预测数据集利用PDP部分依赖图对RF随机森林和LightGBM模型实现可解释性案例

# (3)、计算并绘制PDP图解释模型预测

ML之PDP:基于titanic泰坦尼克是否获救二分类预测数据集利用PDP部分依赖图对RF随机森林和LightGBM模型实现可解释性案例

4.2、Pclass可视化

ML之PDP:基于titanic泰坦尼克是否获救二分类预测数据集利用PDP部分依赖图对RF随机森林和LightGBM模型实现可解释性案例