大講堂 | 面向大資料的圖聚類方法

2018-10-25 23:50:00

雷鋒網AI研習社訊：聚類是統計學、機器學習和資料挖掘領域的重要研究問題之一，其目的是将資料對象劃分為多個類或簇(cluster)，使同一簇中的對象之間有較高的相似度，而不同簇中的對象有較大的差異。聚類是資料分析的重要手段，在客戶分群、基因識别、文本分析、空間資料處理、衛星照片分析、醫療影像自動檢測等領域有着廣泛的應用。基于圖的聚類方法通過将帶權無向圖劃分為兩個或兩個以上的最優子圖，使子圖内部盡量相似，而子圖間距離盡量距離較遠，以達到聚類的目的。與傳統的聚類算法相比，它能工作在任意的空間、能對任意形狀的資料進行聚類。但是，由于這類算法需要進行特征向量分解，具有較高的複雜度，是以在大資料時代面臨巨大的挑戰。我們針對大資料的需求，提出了一系列新的圖聚類方法及優化方法。

分享主題

Graph-based Clustering of Large-scale Data（面向大資料的圖聚類方法）

分享嘉賓

陳小軍，深圳大學計算機與軟體學院講師，主要研究方向為無監督學習、特征選擇、內建學習等。發表了40餘篇學術論文，包括十餘篇CCF A類文章，如SIGKDD、ICDE、ICCV、AAAI、IJCAI、TKDE、TNNLS等。

分享提綱

1、聚類

2、圖聚類及歸一化割

3、分享的工作：

ISR: Improved Spectral Rotation [IJCAI 2017]

DNC: Direct Normalized Cut [SIGKDD 2018]

BKM: Balanced k-means for anchor generation [SIGKDD 2018]

分享時間

（中原標準時間） 10 月 26 日（星期五） 20:00

直播連結

http://www.mooc.ai/open/course/584

想了解更多雷鋒網(公衆号：雷鋒網) AI 研習社直播？

歡迎移步雷鋒網 AI 研習社社群~

雷鋒網版權文章，未經授權禁止轉載。詳情見轉載須知。

大講堂 | 面向大資料的圖聚類方法

繼續閱讀

[HTML5]自定義屬性 data-* 和 jQuery.data 詳解

9.spark Core 進階2--Cashe

2021-2025年中國運動療法（KT）帶行業市場供需與戰略研究報告

C++ 第十五周報告1--《冒泡法排序》

2021年危險化學品經營機關安全管理人員考試題庫及危險化學品經營機關安全管理人員考試技巧

淺談企業活動中進行資料分析的重要性

筆試面試題目：滑動視窗(二)

資料結構與算法（27）——排序（二）

無人機--飛控科普

Dijkstra--簡易版（最短路徑）

Ambari介紹和架構原理

GitHub連夜封殺！這份阿裡 10W 字内部 Java 字面試手冊到底有多強？

【python】【資料處理】畫多元資料分布圖

NOSQL安全攻擊

win10本地scala和spark安裝安裝scala安裝spark

hdu7108哈希