雷鋒網AI研習社訊:聚類是統計學、機器學習和資料挖掘領域的重要研究問題之一,其目的是将資料對象劃分為多個類或簇(cluster),使同一簇中的對象之間有較高的相似度,而不同簇中的對象有較大的差異。聚類是資料分析的重要手段,在客戶分群、基因識别、文本分析、空間資料處理、衛星照片分析、醫療影像自動檢測等領域有着廣泛的應用。基于圖的聚類方法通過将帶權無向圖劃分為兩個或兩個以上的最優子圖,使子圖内部盡量相似,而子圖間距離盡量距離較遠,以達到聚類的目的。與傳統的聚類算法相比,它能工作在任意的空間、能對任意形狀的資料進行聚類。但是,由于這類算法需要進行特征向量分解,具有較高的複雜度,是以在大資料時代面臨巨大的挑戰。我們針對大資料的需求,提出了一系列新的圖聚類方法及優化方法。
分享主題
Graph-based Clustering of Large-scale Data(面向大資料的圖聚類方法)
分享嘉賓
陳小軍,深圳大學計算機與軟體學院講師,主要研究方向為無監督學習、特征選擇、內建學習等。發表了40餘篇學術論文,包括十餘篇CCF A類文章,如SIGKDD、ICDE、ICCV、AAAI、IJCAI、TKDE、TNNLS等。
分享提綱
1、聚類
2、圖聚類及歸一化割
3、分享的工作:
ISR: Improved Spectral Rotation [IJCAI 2017]
DNC: Direct Normalized Cut [SIGKDD 2018]
BKM: Balanced k-means for anchor generation [SIGKDD 2018]
分享時間
(中原標準時間 ) 10 月 26 日(星期五) 20:00
直播連結
http://www.mooc.ai/open/course/584

想了解更多雷鋒網(公衆号:雷鋒網) AI 研習社直播?
歡迎移步雷鋒網 AI 研習社社群~
雷鋒網版權文章,未經授權禁止轉載。詳情見轉載須知。