天天看点

《R语言数据挖掘》——2.5 R语言实现

算法主要部分的r语言实现为:

《R语言数据挖掘》——2.5 R语言实现
《R语言数据挖掘》——2.5 R语言实现

使用等价类的序列模式发现(sequential pattern discovery using equivalent class,spade)算法是应用于序列模式的垂直序列挖掘算法,它采用深度优先策略。算法的特征是:

spade算法是apriori算法的扩展。

算法采用apriori性质。

需要对初始事务数据集进行多次扫描。

采用垂直数据格式。

算法采用简单的连接运算。

所有序列的发现都需要对数据进行3次扫描。

下面是调用spade算法之前的伪代码

f←, ∧k←0, p←{∈∑, support_count(s)≥min_sup}

《R语言数据挖掘》——2.5 R语言实现
《R语言数据挖掘》——2.5 R语言实现

算法主要部分的r语言代码实现是:

《R语言数据挖掘》——2.5 R语言实现

序列规则、标签序列规则和类序列规则都可以从序列模式中生成,这些可以从前面的序列模式发现算法中得到。

继续阅读