天天看點

R語言資料挖掘2.4.2 GSP算法

<b>2.4.2 gsp算法</b>

廣義序列模式(generalized sequential pattern,gsp)算法是一個類似apriori的算法,但它應用于序列模式。該算法是逐層算法,采取寬度優先政策。它具有如下的特征:

gsp算法是apriori算法的擴充。它利用apriori性質(向下封閉),即,給定最小支援計數,若不接受某個序列,則其超序列也将丢棄。

需要對初始事務資料集進行多次掃描。

采用水準資料格式。

每次掃描中,通過将前一次掃描中發現的模式進行自連接配接來産生候選項集。

在第k次掃描中,僅當在第(k-1)次掃描中接受所有的(k-1)子模式,才接收該序列模式。

gsp算法為:

僞代碼為:

繼續閱讀