3.4 svm人臉識别

python代碼：

from __future__ import print_function
from time import time
import logging
import matplotlib.pyplot as plt
from sklearn.model_selection import train_test_split
from sklearn.datasets import fetch_lfw_people
from sklearn.model_selection import GridSearchCV
from sklearn.metrics import classification_report
from sklearn.metrics import confusion_matrix
from sklearn.decomposition import PCA
from sklearn.svm import SVC


def main():
    logging.basicConfig( level=logging.INFO ,format='%(asctime)s %(message)s' )
    peoples = fetch_lfw_people( min_faces_per_person=70 )
    # 下面介紹資料預處理和分類
    # 傳回多少個圖
    shapes,h,w = peoples.images.shape

    # X是特征向量的矩陣，每一行是個執行個體，每一列是個特征值
    X = peoples.data
    # n_featers表示的就是次元
    n_features = X.shape[1]  # 次元：每個人會提取多少的特征值

    # 提取每個執行個體對應每個人臉，目标分類标記，不同的人的身份
    y = peoples.target
    target_names = peoples.target_names
    n_classes = target_names.shape[0]    #多少行，shape就是多少行，多少個人，多少類

    # 下面開始拆分資料，分成訓練集和測試集,有個現成的函數，通過調用train_test_split；來分成兩部分
    X_train, X_test, y_train, y_test = train_test_split(
        X, y, test_size=0.25)

    # 資料降維，因為特征值的次元還是比較高
    n_components = 150

    t0 = time()  # 計算出列印每一步需要的時間
    pca = PCA(n_components=n_components, whiten=True).fit(X_train)
    eigenfaces = pca.components_.reshape((n_components, h, w))

    t0 = time()
    X_train_pca = pca.transform(X_train)  # 特征量中訓練集所有的特征向量通過pca轉換成更低維的矩陣
    X_test_pca = pca.transform(X_test)

    # param_grid把參數設定成了不同的值，C：權重；gamma：多少的特征點将被使用，因為我們不知道多少特征點最好，選擇了不同的組合
    param_grid = {'C': [1e3, 5e3, 1e4, 5e4, 1e5],
                  'gamma': [0.0001, 0.0005, 0.001, 0.005, 0.01, 0.1], }
    # 把所有我們所列參數的組合都放在SVC裡面進行計算，最後看出哪一組函數的表現度最好
    clf = GridSearchCV(SVC(kernel='rbf'), param_grid)
    # 其實模組化非常非常簡單，主要是資料的預處理麻煩
    clf = clf.fit(X_train_pca, y_train)

    # 測試集預測看看準确率能到多少
    y_pred = clf.predict(X_test_pca)
    # print(classification_report(y_test, y_pred, target_names=target_names)) #預測精确度
    # print(confusion_matrix(y_test, y_pred, labels=range(n_classes))) #混淆矩陣

    # 把預測出來的人名存起來
    prediction_titles = [title(y_pred, y_test, target_names, i)
                         for i in range(y_pred.shape[0])]
    plot_gallery(X_test, prediction_titles, h, w)

    # 降維後的圖檔
    eigenface_titles = ['eigenface %d' %i for i in range(eigenfaces.shape[0])]
    # 提取過特征向量之後的臉是什麼樣子
    plot_gallery(eigenfaces, eigenface_titles, h, w)

# 把預測的函數歸類标簽和實際函數歸類标簽，比如布什
def title(y_pred, y_test, target_names, i):
    pred_name = target_names[y_pred[i]].rsplit(' ', 1)[-1]
    true_name = target_names[y_test[i]].rsplit(' ', 1)[-1]
    flag = "No"
    if pred_name == true_name:
        flag = "Yes"
    result = " flag:{0}\n predicted :{1} \n true : {2} ".format(flag,pred_name,true_name)
    return result

#把資料可視化的可以看到，把需要列印的圖列印出來
def plot_gallery(images,titles,h,w,n_row=3,n_col=4):
    """Helper function to plot a gallery of portraits"""
    #在figure上建立一個圖當背景
    plt.figure(figsize=(1.8*n_col,2.4*n_row))
    plt.subplots_adjust(bottom=0,left=.01,right=.99,top=.90,hspace=.35)
    for i in range(n_row * n_col):
        plt.subplot(n_row,n_col,i+1)
        plt.imshow(images[i].reshape((h,w)),cmap=plt.cm.gray)
        plt.title(titles[i],size=12)
        plt.xticks(())
        plt.yticks(())
    plt.show()

main()

人臉識别結果：

3.4 svm人臉識别

降維後結果：

3.4 svm人臉識别

3.4 svm人臉識别

繼續閱讀

簡單文檔分類——樸素貝葉斯算法樸素貝葉斯算法簡單文檔分類執行個體步驟總結樸素貝葉斯分類調用(sklearn)

【分類算法】什麼是分類算法定義分類與聚類分類過程方法

分類算法的評價名額

K-近鄰算法以及圖像分類應用

weka之NB算法

使用weka的select attribute

weka中分類器算法

在weka中內建自己的算法

【多變量線性回歸】學習記錄序思路實作終

申請評分模型拒絕推斷（RI）方法申請評分模型拒絕推斷（RI）方法

【人工智能行業大師訪談1】吳恩達采訪 Geoffery Hinton

【趨高機器視覺】機器視覺技術原了解析及解決方案

吳恩達 coursera ML 第七課總結+作業答案前言目錄正文模型表示作業答案

XGBoost Plotting API以及GBDT組合特征實踐 XGBoost Plotting API以及GBDT組合特征實踐

解碼器用于語義分割：資料依賴的解碼可以實作靈活的特征聚合

2021-2025年中國運動療法（KT）帶行業市場供需與戰略研究報告