网格搜索最优参数

2023-03-17 23:35:00

from sklearn.linear_model import LogisticRegression # 逻辑回归
from sklearn.neighbors import KNeighborsClassifier  # K近邻
from sklearn.svm import SVC                         # 支持向量机
from sklearn.tree import DecisionTreeClassifier     # 决策树
from sklearn.ensemble import RandomForestClassifier # 随机森林
from sklearn.ensemble import AdaBoostClassifier     # AdaBoost
from xgboost.sklearn import XGBClassifier           # Xgboost
from lightgbm.sklearn import LGBMClassifier         # lightgbm

def grid_search(pipeline,param_grid,x_train,y_train,x_test,y_test,num_folds=5,metrics='accuracy'):
    response={}
    gs = GridSearchCV(estimator=pipeline,
                      param_grid=param_grid,
                      cv=num_folds,
                      scoring=metrics)
    search=gs.fit(x_train,y_train)
    print('GridSearch 最优参数：{}，最优分数：{}'.format(search.best_params_,search.best_score_))
    y_pred = gs.predict(x_test)
    if metrics=='roc_auc':
        y_prob=gs.predict_proba(x_test)[:,1]
        score=roc_auc_score(x_test, y_prob)
        print('auc得分',score)
    else:
        score=eval("{}_score".format(metrics))(y_test,y_pred)
        print('{}得分：{:.3f}'.format(metrics,score))
    response['y_pred']=y_pred
    response[metrics]=score
    return response


from sklearn.pipeline import Pipeline
from sklearn.preprocessing import MinMaxScaler

classifiers=[LogisticRegression(solver='liblinear'),
             KNeighborsClassifier(metric='minkowski'),
             SVC(kernel='rbf'), 
             DecisionTreeClassifier(criterion='gini'),
             RandomForestClassifier(criterion='gini'),
             AdaBoostClassifier(),
             XGBClassifier(),
             LGBMClassifier(is_unbalance=True)]
classifier_name=['lr',
                 'kneighborsclassifier',
                 'svc',
                 'decisiontreeclassifier',
                 'randomforestclassifier',
                 'adaboostclassifier',
                 'xgboost',
                 'lightgbm']
classifier_param_grid=[{'lr__C':[0.001, 0.01, 0.1, 1]},
                       {'kneighborsclassifier__n_neighbors':[4,6,8]},
                       {'svc__C':[0.01,0.1,1], 'svc__gamma':[0.01,0.1,1]},
                       {'decisiontreeclassifier__max_depth':range(5,11)},
                       {'randomforestclassifier__n_estimators':range(1,11)},
                       {'adaboostclassifier__n_estimators':range(70,121,10)},
                       {'xgboost__max_depth':[5,7,9]},
                       {'lightgbm__max_depth':range(4,10)}]

for model,model_name,model_param_grid in zip(classifiers,classifier_name,classifier_param_grid):
    pipeline = Pipeline([("scaler",MinMaxScaler()),(model_name,model)])
    res=grid_search(pipeline,model_param_grid,X_train,y_train,X_test,y_test)

网格搜索最优参数

继续阅读

3分钟SAS数据分析入门，3秒赢得开门红Q1:在SAS认证考试里，怎么打开考试题？正规的教材里不教这个，但是考试又要用，

数据分析入门~数据分析的基础逻辑

python数据可视化之日期折线图画法

数据分析入门之KNN影片类型和癌症预测1、预测电影类型2、预测是否患癌症

数据分析入门攻略

2021-02-26 numpy学习

地理空间数据分析入门【Shapely+Geopandas】

数据分析-回归

数据预处理-标准化

数据分析入门：五个习惯让你快速提升职场数据分析能力（连载-3）

Python数据分析入门（十九）：绘制散点图散点图绘制散点图：绘制回归曲线：

Python数据分析（pandas入门）

学习数据分析入门的小伙伴可以看看#数据分析##M y SQL#

STATA数据分析入门-时间序列面板S17-数据查验和比较_

Python数据分析入门（二十二）：数据可视化之绘制雷达图Python学习交流群：1039649593雷达图使用plt.polar绘制雷达图：使用子图绘制雷达图：