天天看點

3.4 svm人臉識别

python代碼:

from __future__ import print_function
from time import time
import logging
import matplotlib.pyplot as plt
from sklearn.model_selection import train_test_split
from sklearn.datasets import fetch_lfw_people
from sklearn.model_selection import GridSearchCV
from sklearn.metrics import classification_report
from sklearn.metrics import confusion_matrix
from sklearn.decomposition import PCA
from sklearn.svm import SVC


def main():
    logging.basicConfig( level=logging.INFO ,format='%(asctime)s %(message)s' )
    peoples = fetch_lfw_people( min_faces_per_person=70 )
    # 下面介紹資料預處理和分類
    # 傳回多少個圖
    shapes,h,w = peoples.images.shape

    # X是特征向量的矩陣,每一行是個執行個體,每一列是個特征值
    X = peoples.data
    # n_featers表示的就是次元
    n_features = X.shape[1]  # 次元:每個人會提取多少的特征值

    # 提取每個執行個體對應每個人臉,目标分類标記,不同的人的身份
    y = peoples.target
    target_names = peoples.target_names
    n_classes = target_names.shape[0]    #多少行,shape就是多少行,多少個人,多少類

    # 下面開始拆分資料,分成訓練集和測試集,有個現成的函數,通過調用train_test_split;來分成兩部分
    X_train, X_test, y_train, y_test = train_test_split(
        X, y, test_size=0.25)

    # 資料降維,因為特征值的次元還是比較高
    n_components = 150

    t0 = time()  # 計算出列印每一步需要的時間
    pca = PCA(n_components=n_components, whiten=True).fit(X_train)
    eigenfaces = pca.components_.reshape((n_components, h, w))

    t0 = time()
    X_train_pca = pca.transform(X_train)  # 特征量中訓練集所有的特征向量通過pca轉換成更低維的矩陣
    X_test_pca = pca.transform(X_test)

    # param_grid把參數設定成了不同的值,C:權重;gamma:多少的特征點将被使用,因為我們不知道多少特征點最好,選擇了不同的組合
    param_grid = {'C': [1e3, 5e3, 1e4, 5e4, 1e5],
                  'gamma': [0.0001, 0.0005, 0.001, 0.005, 0.01, 0.1], }
    # 把所有我們所列參數的組合都放在SVC裡面進行計算,最後看出哪一組函數的表現度最好
    clf = GridSearchCV(SVC(kernel='rbf'), param_grid)
    # 其實模組化非常非常簡單,主要是資料的預處理麻煩
    clf = clf.fit(X_train_pca, y_train)

    # 測試集預測看看準确率能到多少
    y_pred = clf.predict(X_test_pca)
    # print(classification_report(y_test, y_pred, target_names=target_names)) #預測精确度
    # print(confusion_matrix(y_test, y_pred, labels=range(n_classes))) #混淆矩陣

    # 把預測出來的人名存起來
    prediction_titles = [title(y_pred, y_test, target_names, i)
                         for i in range(y_pred.shape[0])]
    plot_gallery(X_test, prediction_titles, h, w)

    # 降維後的圖檔
    eigenface_titles = ['eigenface %d' %i for i in range(eigenfaces.shape[0])]
    # 提取過特征向量之後的臉是什麼樣子
    plot_gallery(eigenfaces, eigenface_titles, h, w)

# 把預測的函數歸類标簽和實際函數歸類标簽,比如布什
def title(y_pred, y_test, target_names, i):
    pred_name = target_names[y_pred[i]].rsplit(' ', 1)[-1]
    true_name = target_names[y_test[i]].rsplit(' ', 1)[-1]
    flag = "No"
    if pred_name == true_name:
        flag = "Yes"
    result = " flag:{0}\n predicted :{1} \n true : {2} ".format(flag,pred_name,true_name)
    return result

#把資料可視化的可以看到,把需要列印的圖列印出來
def plot_gallery(images,titles,h,w,n_row=3,n_col=4):
    """Helper function to plot a gallery of portraits"""
    #在figure上建立一個圖當背景
    plt.figure(figsize=(1.8*n_col,2.4*n_row))
    plt.subplots_adjust(bottom=0,left=.01,right=.99,top=.90,hspace=.35)
    for i in range(n_row * n_col):
        plt.subplot(n_row,n_col,i+1)
        plt.imshow(images[i].reshape((h,w)),cmap=plt.cm.gray)
        plt.title(titles[i],size=12)
        plt.xticks(())
        plt.yticks(())
    plt.show()

main()
           

人臉識别結果:

3.4 svm人臉識别

降維後結果:

3.4 svm人臉識别

繼續閱讀