天天看點

《R語言資料挖掘》——2.3 混合關聯規則挖掘

關聯規則挖掘有兩個有意義的應用:一是多層次和多元度關聯規則挖掘;二是基于限制的關聯規則挖掘。

對于給定的事務資料集,若資料集的某些次元存在概念層次關系,則需要對該資料集進行多層次關聯規則挖掘。對事物資料集可用的任何關聯規則挖掘算法都可以用于該任務。下表給出亞馬遜商店的一個例子。

《R語言資料挖掘》——2.3 混合關聯規則挖掘

下面是多層次模式挖掘的流程圖。

《R語言資料挖掘》——2.3 混合關聯規則挖掘

基于概念層次,低層次概念可以投影到高層次概念,具有高層次概念的新資料集可以代替原始的低層次概念。

可以在每個概念層次計算支援計數。許多類apriori算法在計算支援計數時稍微有些不同。下面是幾種不同的方法:

對所有的層次使用統一的最小支援度門檻值。

對較低的層次使用較小的支援度門檻值。

基于組的最小支援度門檻值。

基于限制的頻繁模式挖掘是使用使用者設定的限制對搜尋空間進行剪枝的啟發式算法。

常見的限制有(但不局限于)以下幾種情況:

知識類型的限制(指定我們想要挖掘什麼)

資料限制(對初始資料集的限制)

次元層次限制

興趣度限制

規則限制

繼續閱讀