天天看點

一種受自然界啟發的聚類算法:鄰域網格聚類(含SCI文章,及對應的matlab程式、資料)

聚類屬于一種無監督學習方法,受自然界山體形式的啟發,設計了一種鄰域網格聚類算法。自然界中獨立的山體可視為一個獨立的類簇,山頂即為類簇中心,山底即為類簇的邊緣。

試想:将二維平面的離散資料點(如圖1所示)以某種特定的方式标記其重要程度(如局部密度),即可将二維平面資料點映射為三維空間内的山體形式(如圖2所示)

一種受自然界啟發的聚類算法:鄰域網格聚類(含SCI文章,及對應的matlab程式、資料)

圖1 二維分布資料點

一種受自然界啟發的聚類算法:鄰域網格聚類(含SCI文章,及對應的matlab程式、資料)

圖2 三維密度分布圖

鄰域網格聚類的主要步驟為:首先将原始資料映射到網格子空間内,同時擷取每個子空間單元格的局部密度,然後依據鄰域關系從具有最大局部密度的單元格出發逐層地吸納單元格,直至搜尋完畢,聚類結束。對于二維空間而言,局部密度分布形式可表示為如圖2所示的山體結構,山頂即為具有相對最大局部密度的聚類中心,每一個山體視為一個類簇。利用鄰域關系完成從山頂至山腳的吸納搜尋過程。

鄰域網格聚類主要步驟表述如下:

    1)将原始資料映射至網格子空間;

    2)以具有最大局部密度的網格單元為起始點,以給定鄰域半徑搜尋其鄰域單元格并标記(如圖 3所示);

    3)以新加入的單元格為基礎,繼續向外擴充搜尋可能的單元格,直至沒有新的單元格加入(如圖 4所示);

    4)在剩餘的單元格中,傳回第 2) 步繼續執行。

一種受自然界啟發的聚類算法:鄰域網格聚類(含SCI文章,及對應的matlab程式、資料)

圖 3 聚類步驟示範

一種受自然界啟發的聚類算法:鄰域網格聚類(含SCI文章,及對應的matlab程式、資料)

圖 4 聚類步驟示範

詳細基本理論可參考文章:https://journals.sagepub.com/doi/abs/10.1177/0954410017751991

文章引用資訊為:

Suo, M., Zhu, B., Zhou, D., An, R., & Li, S. (2019). Neighborhood grid clustering and its application in fault diagnosis of satellite power system. Proceedings of the Institution of Mechanical Engineers, Part G: Journal of Aerospace Engineering, 233(4), 1270–1283. https://doi.org/10.1177/0954410017751991

文章相應程式已經上傳至本網站,下載下傳位址為:https://download.csdn.net/download/buaasuozi/10306381

内附matlab程式,及對應的測試資料。

ps:航空航天領域的期刊一直不被廣大研究者們關注,導緻本刊影響因子較低。但是,那都不重要,重要的是所提出的方法切實可用,能推動某個小的領域前進一小步,足以足以!

在這部分内容研究之後,我又對該方法進行了改進,增加了對密度的考慮,命名為鄰域密度網格聚類方法,可并行計算搜尋聚類樣本,該内容發表在了清華大學學報上,可參考:鄰域密度網格聚類算法及應用[J]. 清華大學學報(自然科學版)2018, 08: 732-739.  DOI:10.16511/j.cnki.qhdxxb.2018.22.025

(該部分程式尚未整理完畢)

歡迎交流探讨相關學術問題。

繼續閱讀