天天看點

模式識别--緒論 什麼是模式識别?模式識别的主要方法及具體應用

一、什麼是模式識别

人類每時每刻在完成某種模式識别的任務,例如讀書看報(文字識别)、茫茫人海中尋找一個夥伴(特征識别)、鳥鳴(聲音識别)……人們對外界對象的幾乎所有認識都是對類别的認識,通過計算機模仿人腦對現實世界各種事物 進行描述、分類、判斷和識别的過程即為模式識别。那麼什麼是模式呢?顧名思義,模式即為模式識别的對象,可以是一些文字,一個人,一張紙,鳥語花香等等一切可以進行識别測量的生活中的事物。

在對模式識别有了大緻的認識之後,開始正式學習前,以下這些關鍵名詞需要了解掌握

樣本(sample):所研究對象的一個個體。

樣本集(sample set): 若幹樣本構成的集合。

類或類别(class):在所有樣本上定義的一個子集,處于同 一類的樣本在某種性質上是不可區分的。

特征(features):指用于表征樣本的觀測,通常是數值表示的某些量化特征,有時也被稱作屬性。如果存在多個特征,則組成了特征向量。

已知樣本(known samples):事先知道類别标号的樣本。

未知樣本(unknown samples):類别标号未知但特征已知的樣本。

模式識别的問題就是用計算的方法根據樣本的特征對樣本進行分類。

二、模式識别的主要方法

(1)基于知識的方法 (Knowledge-based)

例如:AI、專家系統(Expert Systems)

句法(結構)模式識别 (Syntax PR or Structural PR)

(2)基于資料的方法 (Data-based)

例如:統計模式識别方法(Statistical PR)、人工神經網絡(ANN)、 支援向量機(SVM)

基于資料的識别方法,基礎是統計模式識别,即依據統計的原理來建構分類器。下圖為統計模式識别過程

模式識别--緒論 什麼是模式識别?模式識别的主要方法及具體應用

基于資料的模式識别方法适用于已知對象的某些特征與我們所 感興趣的類别性質有關系,但無法确切描述這種關系的情況。

分類和特征之間的關系可以完全确切的描述出來,采用基于知 識的方法更有效;

若二者的關系完全随機,即不存在規律性的練習,應用模式識 别也無法得到有意義的結果。

三、監督模式識别與非監督模式識别

監督模式識别

已知類别,并且能夠獲得類别已知的訓練樣本,這種情況 下建立分類器的問題屬于監督學習問題,稱為監督模式識别。

非監督模式識别

事先我們并不知道類别,也沒有類别已知的樣本。根據樣本特征将樣本分為幾個類(劃分的過程稱為聚類),使屬于同一類的樣本在一定程度上是相似的,而不同類别之間的樣本有較大差異。這種學習過程稱作非監督模式識别。

四、模式識别系統舉例

筆者在此摘錄了一些書籍上的例子,如下:

1、語音識别

2、說話人識别(通過語音來确定說話者的身份)

3、字元與文字識别

4、複雜圖像中特定目标的識别(道路檢測、複雜圖像中人臉檢測)

5、根據地震勘探資料對地下存儲性質的識别

6、利用基因表達資料進行癌症的分類

五、模式識别系統的典型構成

一個模式識别系統通常包括原始資料的擷取和預處理、 特征提取與選擇、分類或聚類、後處理 四個主要部分。

監督模式識别(supervised PR):

模式識别--緒論 什麼是模式識别?模式識别的主要方法及具體應用

監督模式識别問題一般步驟:

分析問題---->原始特征擷取—>特征提取與選擇—>設計分類器

非監督模式識别(unsupervised PR)

模式識别--緒論 什麼是模式識别?模式識别的主要方法及具體應用

非監督模式識别問題一般步驟:

分析問題---->原始特征擷取—>特征提取與選擇—>聚類分析—>結果解釋

差別:

監督模式識别需要訓練資料,根據訓練樣本設計分類器

非監督模式識别則不需要訓練資料,是根據樣本的相似性來進行分類的。

特征提取與選擇、分類器設計和聚類分析,以及分類器和聚類結果的性能評價方法 等是各種模式識别系統中具有共性的步驟,是整個系統的核心,也是模式識别學科研究的主要内容。

筆者最近在學習模式識别,以上是對模式識别的基本概念做了大緻闡述,與大家分享,共同學習,共同進步。若有描述不當的地方,還請指正,感激不盡!

參考所學書籍《模式識别》第三版 (張工學先生編著)

繼續閱讀