搜索到321篇“ 最大频繁项目集“的相关文章
基于改进频繁模式树的最大频繁项目集更新挖掘算法
2018年
在挖掘最大频繁项目集的过程中,通过改变最小支持度阈值可以挖掘更有用的最大频繁项目集,为此提出了一种最大频繁项目集更新挖掘算法UAMMFI(Updating Algorithm for Mining Maximal Frequent Itemsets)。算法基于改进后的频繁模式树结构,在更新挖掘过程中,不需产生候选项目集和条件模式树,并且充分利用先前已挖掘的最大频繁项目集中包含的信息,快速更新挖掘出最小支持度阈值变化后的最大频繁项目集。实验结果表明,算法能够高效更新挖掘最大频繁项目集
赵群礼郭玉堂史君华
关键词:关联规则最大频繁项目集
一种改进的基于FP-Tree的高效挖掘最大频繁项目集算法被引量:8
2017年
为了解决最大频繁项目集算法DMFIA(discover maximum frequent itemsets algorithm)在挖掘候选项目集维数较大而最大频繁项目集维数较小的情况下产生大量候选项目集的问题,提出一种改进的基于FP-Tree(frequent pattern tree)的最大频繁项目集挖掘的FP-EMFIA算法;该算法在挖掘过程中根据项目头表,采用自上而下和自下而上的双向搜索策略,并通过条件模式基中的频繁项目和较小维数的非频繁项目集对候选项目集进行降维和剪枝,以减少候选项目集的数量,加速对候选计数的操作。在经典数据mushroom、chess和connect上的实验结果表明,FP-EMFIA算法在支持度较小时的时间效率优于DMFIA、IDMFIA(improved algorithm of DMFIA)和BDRFI(algorithm for mining frequent itemsets based on decreasing dimensionality reduction of frequent itemsets)算法的,说明FP-EMFIA算法在候选项目集维数较大时有相对优势。
尹治华张大鹏谭明王新生
关键词:数据挖掘关联规则最大频繁项目集频繁模式树
基于频繁模式树的最大频繁项目集挖掘算法研究
随着互联网技术的快速发展,数据挖掘领域受到了越来越多的关注。关联规则一直是该领域的研究热点,主要是为了发现数据之间的关联以及有趣的模式。挖掘最大频繁项目集作为关联规则的一个重要的研究内容,它不仅已经涵盖了所有的频繁项目集...
尹治华
关键词:频繁模式树最大频繁项目集关联规则数据挖掘
基于FP-Tree的最大频繁项目集挖掘算法被引量:6
2015年
挖掘最大频繁项目集是关联规则挖掘中的关键问题,基于Apriori产生候选项目集需要付出很高的代价,尤其是在存在大量强模式或长模式的时候.提出一种基于频繁模式树(FP-Tree)的最大频繁项目集挖掘算MFIP-Miner(maximum frequent itemsets pattern miner),其挖掘过程无需产生候选项,从而提高挖掘效率。
陈向华刘可昂
关键词:数据挖掘最大频繁项集关联规则频繁模式树
大数据环境下的最大频繁项目集挖掘算法
挖掘最大频繁项目集是数据挖掘领域的一个重要问题,而在大数据环境下,如何利用分布式架构进行全局最大频繁项目集的挖掘,是一个富有实用意义的问题。根据分布式数据库往往具有稀疏性和可归并性的实际特点,本文提出了一种基于事务分类...
林宇
关键词:数据挖掘最大频繁项目集分布式大数据
基于FPMAX的最大频繁项目集挖掘改进算法被引量:9
2013年
挖掘事务数据库中的最大频繁项目集是数据挖掘领域一个重要的研究方向。基于FP-tree的FPMAX算法是目前较为高效与稳定的最大频繁项目集挖掘算法之一。然而对于稠密数据库中的挖掘,FPMAX会产生大量的冗余递归过程,导致额外的条件FP-tree构造开销。而且在支持度较低时,FPMAX则会因用于超检测的全局MFItree较为庞大而导致超检测的性能下降。为此提出FPMAX的改进算法FPMAX-reduce,其通过采用基于事务共同后缀的前瞻剪枝策略来减少挖掘过程中的冗余递归过程。当递归过程中产生的新条件FP-tree规模较小时,FPMAX-reduce通过构造条件MFI-tree来减小后续超检测遍历的开销。性能试验表明,FPMAX-reduce算法通过有效的前瞻剪枝,在稠密事务数据库以及低支持度的情况下至多可将递归过程减少至原算法的一半以下,进而有效地提高了FPMAX算法的效率。
牛新征佘堃
关键词:频繁项目集最大频繁项目集FP-TREEFP-GROWTH
基于FPMAX的最大频繁项目集挖掘改进算法
事务数据库中的最大频繁项目集是数据挖掘领域一个重要的研究方向.基于FP-tree的FPMAX算法是目前较为高效与稳定的最大频繁项目集挖掘算法之一.然而对于稠密数据库中的挖掘,FPMAX会产生大量的冗余递归过程,导致额外的...
牛新征佘堃
关键词:数据挖掘最大频繁项目集优化算法
基于OWSFP-Tree的最大频繁项目集挖掘算法被引量:5
2013年
为了解决FP-Max算法挖掘最大频繁项目集时递归生成条件模式树和超检验的问题,提出了基于单向有序FP-Tree的NCFP-Max算法。该算法在挖掘过程中采用预剪枝策略减少挖掘结点,利用单向有序FP-Tree避免每次存储当前挖掘出的频繁项目集之前都需要超检验,利用项目表格避免递归生成条件模式树减少时空资源。实验结果表明,在事务条数多、项的数量大的情况下,NCFP-Max算法的挖掘时间比FP-Max算法缩短了50%左右。
赵志刚王芳万军
关键词:数据挖掘关联规则最大频繁项目集FP-TREE
大数据环境下的最大频繁项目集挖掘算法
挖掘最大频繁项目集是数据挖掘领域的一个重要问题,而在大数据环境下,如何利用分布式架构进行全局最大频繁项目集的挖掘,是一个富有实用意义的问题。根据分布式数据库往往具有稀疏性和可归并性的实际特点,本文提出了一种基于事务分类...
林宇
关键词:数据挖掘最大频繁项目集分布式大数据
文献传递
基于改进FP-tree的最大频繁项目集挖掘算法被引量:9
2012年
针对已有算法为了减少PF-tree中路径被重复遍历的次数,需要保存FP-tree中所有频繁1-项的条件模式基的问题,对FP-tree的数据结构进行修改,使得只需要保存FP-tree中每个叶子节点的父节点到根节点路径上项目组成的条件模式基,降低了保存条件模式基的存储空间开销。在分析最大频繁项目集挖掘算法中搜索空间以及数据表示方法的基础上,通过理论分析和证明,设计了剪枝策略和压缩策略,缩小了算法搜索空间,压缩了FP-tree的规模,提高了算法的执行效率。最后将新算法分别与NHTFPG算法、FpMAX算法进行对比,验证算法的正确性和有效性。实验结果表明,新算法保存FP-tree条件模式基所需要的存储空间不到NHTFPG算法的50%,执行效率比FpMAX算法提高了2~3倍。
马丽生姚光顺杨传健
关键词:频繁项目集最大频繁项目集剪枝策略

相关作者

宋余庆
作品数:219被引量:1,123H指数:15
供职机构:东南大学
研究主题:医学图像 数据挖掘 图像分割 关联规则 频繁模式树
朱玉全
作品数:168被引量:999H指数:15
供职机构:江苏大学
研究主题:数据挖掘 关联规则 增量式更新 频繁项目集 医学图像
赵群礼
作品数:11被引量:48H指数:5
供职机构:合肥师范学院计算机科学与技术系
研究主题:关联规则 最大频繁项目集 频繁模式树 数据挖掘 FP-TREE
李忠哗
作品数:17被引量:37H指数:4
供职机构:河北北方学院
研究主题:数据挖掘 关联规则 最大频繁项目集 频繁模式树 最大频繁模式
孙志挥
作品数:187被引量:2,099H指数:26
供职机构:东南大学计算机科学与工程学院
研究主题:数据挖掘 关联规则 数据库 频繁模式树 数据流