1.实验目的

(1)对数据进行分析，以找出哪些变量对员工保留有直接和明显的影响（即它们是离开公司还是继续工作）

（2）绘制条形图，显示员工工资对保留率的影响

绘制条形图，显示部门和员工保留之间的相关性

（3）构建逻辑回归模型并计算模型的准确性

2.导入必要模块并读取数据

import pandas as pd    
import matplotlib.pyplot as plt
%matplotlib inline

df = pd.read_csv('HR_comma_sep.csv')
df.shape    #14999条数据，10个字段
left = df[df.left==1]     #离职
left.shape
retained = df[df.left==0]   #在职
retained.shape

3.可视化分析数据

df.groupby('left').mean()     #按是否离职对数据分组
#0表示在职，1表示离职

机器学习代码实战——逻辑回归（Logistic Regression）1.实验目的2.导入必要模块并读取数据3.可视化分析数据4.数据预处理5.训练+预测

4.数据预处理

subdf = df[['satisfaction_level','average_montly_hours','promotion_last_5years','salary']]  #提取5个影响因素
subdf.head()

salary_dummies = pd.get_dummies(subdf.salary,prefix='salary')   #将salary字段数字化 ，转化后的字段加前缀salary

df_with_dummies = pd.concat([subdf,salary_dummies],axis='columns')  #拼接字段
df_with_dummies.head()

机器学习代码实战——逻辑回归（Logistic Regression）1.实验目的2.导入必要模块并读取数据3.可视化分析数据4.数据预处理5.训练+预测

df_with_dummies.drop('salary',axis='columns',inplace=True)   #删除原salary字段
df_with_dummies.head()

机器学习代码实战——逻辑回归（Logistic Regression）1.实验目的2.导入必要模块并读取数据3.可视化分析数据4.数据预处理5.训练+预测

X = df_with_dummies    #数据
y = df.left      #标签

5.训练+预测

from sklearn.model_selection import train_test_split
from sklearn.linear_model import LogisticRegression    #导入逻辑回归模块

X_train, X_test, y_train, y_test = train_test_split(X,y,test_size=0.2)
model = LogisticRegression()   #实例化模型
model.fit(X_train, y_train)   #训练

model.predict(X_test)   #预测
model.score(X_test,y_test)   #计算得分
model.coef_     #打印系数
model.intercept_   #打印截距

机器学习代码实战——逻辑回归（Logistic Regression）1.实验目的2.导入必要模块并读取数据3.可视化分析数据4.数据预处理5.训练+预测

机器学习代码实战——逻辑回归（Logistic Regression）1.实验目的2.导入必要模块并读取数据3.可视化分析数据4.数据预处理5.训练+预测

文章目录

1.实验目的

2.导入必要模块并读取数据

3.可视化分析数据

4.数据预处理

5.训练+预测

继续阅读

XGBoost Plotting API以及GBDT组合特征实践 XGBoost Plotting API以及GBDT组合特征实践

解码器用于语义分割：数据依赖的解码可以实现灵活的特征聚合

YAML简介和PyYAML安全操作YAML支持的类型YAML的优点：yaml的基本语法python操作

2021-2025年中国运动疗法（KT）带行业市场供需与战略研究报告

Small tricks

libsvm for python 安装

学习软件测试基础测试第七天

Zeppelin 配置访问 REST APIApache Zeppelin Configuration REST API

【Torch】最简洁logging使用指南

27. Remove Element(列表)题目代码

Cloud Studio初体验

使用 ctypes 进行 Python 和 C 的混合编程

【python】【数据处理】画多维数据分布图

【python】netconf协议对接管理设备

「Python 网络自动化」NETCONF —— Python 使用 NETCONF 管理配置 H3C 网络设备

在python中创建excel并写入