2.4.2 GSP算法
 
  
 广义序列模式(Generalized Sequential Pattern,GSP)算法是一个类似Apriori的算法,但它应用于序列模式。该算法是逐层算法,采取宽度优先策略。它具有如下的特征:
 
 GSP算法是Apriori算法的扩展。它利用Apriori性质(向下封闭),即,给定最小支持计数,若不接受某个序列,则其超序列也将丢弃。
 
 需要对初始事务数据集进行多次扫描。
 
 采用水平数据格式。
 
 每次扫描中,通过将前一次扫描中发现的模式进行自连接来产生候选项集。
 
 在第k次扫描中,仅当在第(k-1)次扫描中接受所有的(k-1)子模式,才接收该序列模式。
 
 GSP算法为:
 
  
 
 伪代码为:
 
                
        
 
相关资源:基于不确定数据的可能频繁闭序列模式挖掘