天天看點

《模式識别原理及工程應用》一1.3 模式識别系統

模式識别系統由兩個過程組成,即設計和實作。設計是指用一定數量的樣本進行分類器的設計,實作是指用所設計的分類器對要識别的樣本進行分類決策。本書隻讨論決策理論方法,基于決策理論的模式識别系統主要由4個部分組成:資料擷取,預處理,特征提取和選擇,分類決策,如圖1-3-1所示。

下面我們對這幾個部分作簡單的說明。

1.資料擷取

為了使計算機能夠對各種現象進行分類識别,要用計算機可以運算的符号來表示所研究的對象,通常輸入對象的資訊有以下3種類型:

1)二維圖像:如文字、指紋、地圖、照片這類對象。

2)一維波形:如腦電圖、心電圖、機械振動波形等。

3)實體參量和邏輯值:前者如在疾病診斷中病人的體溫及各種化驗資料等;後者如對某參量正常與否的判斷或對症狀有無的描述。

通過測量、采集和量化,可以用矩陣或向量表示二維圖像或一維波形。這就是資料擷取的過程。

2.預處理

預處理的目的是去除噪聲,加強有用的資訊,并對輸入測量儀器或其他因素所造成的退化線性進行複原。

3.特征提取和選擇

由圖像或波形所獲得的資料量是相當大的。例如,一個文字圖像可以有幾千個資料,一個心電圖波形也可能有幾千個資料,一個衛星遙感圖像的資料量就更大。為了有效地實作分類識别,就要對原始資料進行變換,得到最能反映分類本質的特征。這就是特征提取和選擇的過程。一般我們把原始資料組成的空間叫做測量空間,把分類識别賴以進行的空間叫做特征空間,通過變換,可把在維數較高的測量空間中表示的模式變為在維數較低的特征空間中表示的模式。特征空間中的一個模式通常也叫做一個樣本,它往往可以表示為一個向量,也就是特征空間中的一個點。

4.分類決策

分類決策就是在特征空間中用統計方法把被識别對象歸為某一類别。基本做法是在樣本訓練集的基礎上确定某個判别規則,使按這種判别規則對被識别對象進行分類所造成的錯誤識别率最小或引起的損失最小。