天天看點

模糊數學 3、模糊聚類

------------------------2020.8.17更新------------------------------

模糊數學視訊連結:https://pan.baidu.com/s/1_JBbmzcaiG8M1ZZ9TfZb8g

提取碼:46z7

------------------------2020.8.17更新------------------------------

模糊數學 1、模糊集、隸屬度函數、如何确定隸屬度函數

模糊數學 2、基本的一些模糊矩陣,以及模糊矩陣的運算

模糊數學 3、模糊聚類

模糊數學 4、模糊模式識别

模糊數學 5、模糊綜合評判

懶了幾天了,把模糊數學後面的學了,繼續總結一下。

模糊聚類

首先是資料的标準化

        假設有m個對象,每個對象有n個特征來描述,構成的矩陣就是m*n的一個矩陣(行i代表一個對象,列j代表一個特征,(i,j)就是滴i個對象的第j個特征的值),每個特征的衡量的量綱不一樣,是以我們要對資料進行标準化(或者叫歸一化),即把每個特征的取值都變到0-1之間

模糊數學 3、模糊聚類
模糊數學 3、模糊聚類

建立模糊相似矩陣

        歸一化以後,我們想知道兩個對象(矩陣的兩行)是相似還是不相似呢?我們用相似度來判斷兩個對象是否相似,那麼可以得到m*m的相似矩陣R(因為有m個對象,而且這個矩陣是對稱矩陣)。

        這個相似度怎麼算呢,有以下幾種方法:

        1、相似系數法。比如夾角餘弦法、相關系數法。主要思想是把每個對象看成一個向量,計算向量間的一些數學關系。

        2、距離法。比如歐氏距離、海明距離、切比雪夫距離、曼哈頓距離等等。思想就是把每個對象看成高維空間的一個點,計算點之間的距離。

        3、貼近度法。模糊數學特有的一種方法,比如最大最小法,算術平均最小法、幾何平均最小法。主要是利用模糊數學中的一些運算,我貼張圖。

模糊數學 3、模糊聚類

        利用随便哪種方法,按公式就求得出對象兩兩之間的相似度,組成相似矩陣R。

計算傳遞閉包矩陣

        課件介紹的是用平方法求傳遞閉包,意思就是說對R不斷平方,直到平方後的值與平方前的值一樣,就算是找到傳遞閉包矩陣了。

畫動态聚類圖

        說之前先介紹一個模糊矩陣的\(\lambda\)-截矩陣,主要就是說我們給定一個值\(\lambda\),矩陣中比\(\lambda\)大的變成1,小的變成0。就把被截的那個矩陣變成0/1的布爾矩陣了。

        開始畫動态聚類圖:

        1、對剛計算出來的傳遞閉包矩陣的所有元素排個序(一般隻有m個數,m是對象個數(這個我沒仔細研究,做過幾個列子都是))

        2、\(\lambda\)分别取排序的那幾個數,去截傳遞閉包矩陣,可以得到一堆的布爾矩陣。

個人拙見

        我是覺得最後一步沒啥必要,我們人為給定一個相似度的門檻值\(\lambda\),不就好了,相似度比這個大的我們認為是一類,比這個小的我們認為是另外一類。

        至于要不要算傳遞閉包,我覺得這個操作的實體含義我還要思考下,為什麼要做這一步,不做這一步直接截原始的相似度矩陣R會得出奇怪的結論。

模糊數學 3、模糊聚類

        比如上面這個,我定義\(\lambda\)=0.6,有個奇怪的的結論。1、3、4一類。2、4一類,5單獨一類。這個四咋會既屬于這一類又屬于哪一類,就比較奇怪。難倒1、2、3、4是一類?顯然2和1的相似度沒有0.6呀。

        我還要思考一下

模糊數學 3、模糊聚類