天天看點

個人學習總結一機器學習入門(二)

(項目進入籌劃階段了,第一周已經快過去了,周一将會再次開會,部落格繼續更新)

上一篇簡單講了講機器學習,也算是開篇的簡介吧,算是開胃小菜,有利接下來主食的消化。

這一篇呢,思前想後,最後想細細講講模式識别的部分,因為一是上篇也略略一提,二是我覺得我們項目也需要這一部分的概念,會涉及到這一相關領域。

個人學習總結一機器學習入門(二)

以上是摘自百度百科對模式識别的解釋,和上一篇一樣,下面我來用我的了解來講講。

首先講講“模式識别”中的模式是何許物也,我們知道,被識别的對象都具有一些屬性、狀态或者特征,而對象之間的差異也就表現在這些特征的差異上。是以可以用對象的特征來表征對象。另外,從結構的來看,有些被識别的對象可以看做是由若幹基本成分按一定的規則組合而成。是以,可以用一些基本元素的某種組合來刻畫對象。

廣義的說,存在于時間和空間中可觀察的事物(對象),如果可以差別它們是否相同或相似,都可以稱之為“模式”;狹義地說,模式是通過對具體的個别事物進行觀測所得的具有時間和空間的分布的資訊。模式的特定特質是指可以用來區分觀察對象是否相同或是受相似而選擇的特性。模式具有直覺特性:可觀察性、可區分性和相似性。

值得一說的是模式并不是指事物本身,而是從事物獲得的資訊,能夠表征或刻畫被識别對象類屬特征的資訊模型成為對象的模式。

有了模式,對實體對象的識别就轉化為對其模式的識别。模式表示一類事物,當模式和樣本共同使用時,樣本是具體的事物,而模式是對同一類事物的概念性的概況。如一個人的許多照片是這個人的許多樣本,而這個人本事是一個模式。

個人學習總結一機器學習入門(二)

然後初步了解了模式之後我們再來看模式識别。

識别是對各種事物或現象的的分析、描述和判斷。模式識别是指在某些一定量度或觀測基礎上,把待識别模式劃分到各自的模式類(這裡解釋下模式類,具有相似特性的模式的集合成為模式類)中去,根據模式的特性,将其判斷為一類。

就好比人再見到一個桌子具體的物品時會分辨出它的類名,如方桌和圓桌都會歸結為桌子。這是人可以做到的識别事物的功能,也就是人的模式識别 。而我們其實要講的是計算機實作人對各種事物和現象的分析和描述、判斷、識别,是一種智能活動。

而模式識别系統是指用來實作對所見的事物(樣本)确定其類别、執行模式識别功能的整個計算機系統。

目前,已知最好的模式識别系統是什麼,大家猜一下是什麼吧,沒錯是人類的大腦。模式識别的主要目的是如何用計算機進行模式識别,對樣本進行分類。一個典型的模式識别系統的組成如下圖所示。

個人學習總結一機器學習入門(二)

(1)資訊擷取。用計算機可以運算的符号來表示所研究的對象,可以是二維圖像,如文字、指紋、地圖、照片等,可以使一維波形,如腦電圖、心電圖、機械振動波形等,實體參數和邏輯值,如體溫、化驗資料、參數正常與否的表述。

(2)預處理。去除信号的噪聲,提取有用資訊,使資訊純化,或是對輸入測量儀器或者其他因素所造成的退化現象進行的複原。預處理這個環節内容很廣泛,與要解決的具體問題有關。這裡就還是拿我們項目舉例,我們是要識别果蔬種類,自然就要對擷取的果蔬圖像進行預處理,先把果蔬從圖像中找出來,然後對果蔬圖像進行簡單的去噪,劃分,濾波,做到這一步之後,才能對果蔬圖像進行系統的識别。

(3)特征的提取和選擇。要對預處理的信号進行變換,得到最能反映事物分類本質的本質特征。同時對特征進行必要的降維處理。換句話說,特征提取和選擇的目的就是選擇什麼樣的方法來描述事物,進而有效的、牢靠的把事物正确的區分開。

(4)分類器設計和決策。分類器設計是指依據特定空間分布,設計及決定分類器的具體參數。分類決策是指依據分類器設計階段的預處理特征提取與選擇及判決函數模型,對擷取的未知樣本資料進行分類識别,吧識别對象歸為某一類,輸出類結果。

最後講講模式識别的方法。

具體分為四類:統計決策法、結構模式識别方法、模糊模式識别方法和人工神經網絡識别方法。

1.統計決策法:以機率論和數理統計為基礎,包括參數和非參數方法:

1)參數方法。主要以貝葉斯決策準則為指導。

2)非參數方法。

2.結構模式識别:

結構模式識别是利用結構描述與句法描述之間的相似性對模式進行分類。主要用于文字識别、遙感圖形的識别與分析、紋理圖像的分析。

3.模糊模式識别:

模糊模式識别的關鍵在于隸屬度函數的建立,目前主要的函數方法為模糊統計法、模糊分布法、二進制對比排序法、相對比較法和專家評分法。

4.人工神經網絡模式識别:

早在20世紀50年代,研究人員就開始模拟動物系統的某種功能,采用軟體或硬體的辦法,建立了許多以大量的處理單元為節點,處理單元間實作互聯的拓撲結構網絡,實作模拟,稱之為人工神經網絡模式識别。

人工神經網絡是一種複雜的非線性映射方法,其實體意義比較難以解釋,在理論上也還存在一系列亟待解決的問題,但其具有較強的解決複雜的模式識别的能力,和更合乎邏輯的模糊識别日益得到人們的重視。

(模式識别就講到這,下一篇應該是關于計算機視覺的了,下周更,文中有些定義引自楊幫華李昕等人著的模式識别技術及其應用)

繼續閱讀