R语言数据挖掘2.4.2 GSP算法

    xiaoxiao2024-06-06  114

    2.4.2 GSP算法

    广义序列模式(Generalized Sequential Pattern,GSP)算法是一个类似Apriori的算法,但它应用于序列模式。该算法是逐层算法,采取宽度优先策略。它具有如下的特征:

    GSP算法是Apriori算法的扩展。它利用Apriori性质(向下封闭),即,给定最小支持计数,若不接受某个序列,则其超序列也将丢弃。

    需要对初始事务数据集进行多次扫描。

    采用水平数据格式。

    每次扫描中,通过将前一次扫描中发现的模式进行自连接来产生候选项集。

    在第k次扫描中,仅当在第(k-1)次扫描中接受所有的(k-1)子模式,才接收该序列模式。

    GSP算法为:

     

    伪代码为:

    相关资源:基于不确定数据的可能频繁闭序列模式挖掘
    最新回复(0)