天天看點

《R語言資料挖掘》——2.5 R語言實作

算法主要部分的r語言實作為:

《R語言資料挖掘》——2.5 R語言實作
《R語言資料挖掘》——2.5 R語言實作

使用等價類的序列模式發現(sequential pattern discovery using equivalent class,spade)算法是應用于序列模式的垂直序列挖掘算法,它采用深度優先政策。算法的特征是:

spade算法是apriori算法的擴充。

算法采用apriori性質。

需要對初始事務資料集進行多次掃描。

采用垂直資料格式。

算法采用簡單的連接配接運算。

所有序列的發現都需要對資料進行3次掃描。

下面是調用spade算法之前的僞代碼

f←, ∧k←0, p←{∈∑, support_count(s)≥min_sup}

《R語言資料挖掘》——2.5 R語言實作
《R語言資料挖掘》——2.5 R語言實作

算法主要部分的r語言代碼實作是:

《R語言資料挖掘》——2.5 R語言實作

序列規則、标簽序列規則和類序列規則都可以從序列模式中生成,這些可以從前面的序列模式發現算法中得到。

繼續閱讀