天天看点

R语言数据挖掘2.4.2 GSP算法

<b>2.4.2 gsp算法</b>

广义序列模式(generalized sequential pattern,gsp)算法是一个类似apriori的算法,但它应用于序列模式。该算法是逐层算法,采取宽度优先策略。它具有如下的特征:

gsp算法是apriori算法的扩展。它利用apriori性质(向下封闭),即,给定最小支持计数,若不接受某个序列,则其超序列也将丢弃。

需要对初始事务数据集进行多次扫描。

采用水平数据格式。

每次扫描中,通过将前一次扫描中发现的模式进行自连接来产生候选项集。

在第k次扫描中,仅当在第(k-1)次扫描中接受所有的(k-1)子模式,才接收该序列模式。

gsp算法为:

伪代码为:

继续阅读