9.3 基于Eclat算法的频繁项集挖掘
Eclat算法是一种与FP-Growth算法,Apriori算法思路不尽相同的算法,它是利用倒排索引的思想,但并不是利用倒排索引进行快速查找,而是进行数据统计。
构建倒排索引后,由频繁N项集进行求集的操作,得到候选的N+1项集,再求候选的N+2项集,不断迭代该过程,直到项集归一。
利用倒排索引快速构建频繁项集是Eclat算法中的应用技巧,因为倒排表是一种适合于关系型计算的关系。Eclat算法把交易信息(事务)划分到每个项之下,使Eclat算法可以利用集合的简单运算即可得到的频繁项集。