搜索到321 篇“ 最大频繁项目集 “的相关文章
基于改进频繁 模式树的最大 频繁 项目集 更新挖掘算法 2018年 在挖掘最大 频繁 项目集 的过程中,通过改变最小支持度阈值可以挖掘更有用的最大 频繁 项目集 ,为此提出了一种最大 频繁 项目集 更新挖掘算法UAMMFI(Updating Algorithm for Mining Maximal Frequent Itemsets)。算法基于改进后的频繁 模式树结构,在更新挖掘过程中,不需产生候选项目集 和条件模式树,并且充分利用先前已挖掘的最大 频繁 项目集 中包含的信息,快速更新挖掘出最小支持度阈值变化后的最大 频繁 项目集 。实验结果表明,算法能够高效更新挖掘最大 频繁 项目集 。 赵群礼 郭玉堂 史君华关键词:关联规则 最大频繁项目集 一种改进的基于FP-Tree的高效挖掘最大 频繁 项目集 算法 被引量:8 2017年 为了解决最大 频繁 项目集 算法DMFIA(discover maximum frequent itemsets algorithm)在挖掘候选项目集 维数较大而最大 频繁 项目集 维数较小的情况下产生大量候选项目集 的问题,提出一种改进的基于FP-Tree(frequent pattern tree)的最大 频繁 项目集 挖掘的FP-EMFIA算法;该算法在挖掘过程中根据项目 头表,采用自上而下和自下而上的双向搜索策略,并通过条件模式基中的频繁 项目 和较小维数的非频繁 项目集 对候选项目集 进行降维和剪枝,以减少候选项目集 的数量,加速对候选集 计数的操作。在经典数据集 mushroom、chess和connect上的实验结果表明,FP-EMFIA算法在支持度较小时的时间效率优于DMFIA、IDMFIA(improved algorithm of DMFIA)和BDRFI(algorithm for mining frequent itemsets based on decreasing dimensionality reduction of frequent itemsets)算法的,说明FP-EMFIA算法在候选项目集 维数较大时有相对优势。 尹治华 张大鹏 谭明 王新生关键词:数据挖掘 关联规则 最大频繁项目集 频繁模式树 基于频繁 模式树的最大 频繁 项目集 挖掘算法研究 随着互联网技术的快速发展,数据挖掘领域受到了越来越多的关注。关联规则一直是该领域的研究热点,主要是为了发现数据之间的关联以及有趣的模式。挖掘最大 频繁 项目集 作为关联规则的一个重要的研究内容,它不仅已经涵盖了所有的频繁 项目集 ... 尹治华关键词:频繁模式树 最大频繁项目集 关联规则 数据挖掘 基于FP-Tree的最大 频繁 项目集 挖掘算法 被引量:6 2015年 挖掘最大 频繁 项目集 是关联规则挖掘中的关键问题,基于Apriori产生候选项目集 需要付出很高的代价,尤其是在存在大量强模式或长模式的时候.提出一种基于频繁 模式树(FP-Tree)的最大 频繁 项目集 挖掘算MFIP-Miner(maximum frequent itemsets pattern miner),其挖掘过程无需产生候选项集 ,从而提高挖掘效率。 陈向华 刘可昂关键词:数据挖掘 最大频繁项集 关联规则 频繁模式树 大数据环境下的最大 频繁 项目集 挖掘算法 挖掘最大 频繁 项目集 是数据挖掘领域的一个重要问题,而在大数据集 环境下,如何利用分布式架构进行全局最大 频繁 项目集 的挖掘,是一个富有实用意义的问题。根据分布式数据库往往具有稀疏性和可归并性的实际特点,本文提出了一种基于事务分类... 林宇关键词:数据挖掘 最大频繁项目集 分布式 大数据 基于FPMAX的最大 频繁 项目集 挖掘改进算法 被引量:9 2013年 挖掘事务数据库中的最大 频繁 项目集 是数据挖掘领域一个重要的研究方向。基于FP-tree的FPMAX算法是目前较为高效与稳定的最大 频繁 项目集 挖掘算法之一。然而对于稠密数据库中的挖掘,FPMAX会产生大量的冗余递归过程,导致额外的条件FP-tree构造开销。而且在支持度较低时,FPMAX则会因用于超集 检测的全局MFItree较为庞大而导致超集 检测的性能下降。为此提出FPMAX的改进算法FPMAX-reduce,其通过采用基于事务共同后缀的前瞻剪枝策略来减少挖掘过程中的冗余递归过程。当递归过程中产生的新条件FP-tree规模较小时,FPMAX-reduce通过构造条件MFI-tree来减小后续超集 检测遍历的开销。性能试验表明,FPMAX-reduce算法通过有效的前瞻剪枝,在稠密事务数据库以及低支持度的情况下至多可将递归过程减少至原算法的一半以下,进而有效地提高了FPMAX算法的效率。 牛新征 佘堃关键词:频繁项目集 最大频繁项目集 FP-TREE FP-GROWTH 基于FPMAX的最大 频繁 项目集 挖掘改进算法 事务数据库中的最大 频繁 项目集 是数据挖掘领域一个重要的研究方向.基于FP-tree的FPMAX算法是目前较为高效与稳定的最大 频繁 项目集 挖掘算法之一.然而对于稠密数据库中的挖掘,FPMAX会产生大量的冗余递归过程,导致额外的... 牛新征 佘堃关键词:数据挖掘 最大频繁项目集 优化算法 基于OWSFP-Tree的最大 频繁 项目集 挖掘算法 被引量:5 2013年 为了解决FP-Max算法挖掘最大 频繁 项目集 时递归生成条件模式树和超集 检验的问题,提出了基于单向有序FP-Tree的NCFP-Max算法。该算法在挖掘过程中采用预剪枝策略减少挖掘结点,利用单向有序FP-Tree避免每次存储当前挖掘出的频繁 项目集 之前都需要超集 检验,利用项目 表格避免递归生成条件模式树减少时空资源。实验结果表明,在事务条数多、项的数量大的情况下,NCFP-Max算法的挖掘时间比FP-Max算法缩短了50%左右。 赵志刚 王芳 万军关键词:数据挖掘 关联规则 最大频繁项目集 FP-TREE 大数据环境下的最大 频繁 项目集 挖掘算法 挖掘最大 频繁 项目集 是数据挖掘领域的一个重要问题,而在大数据集 环境下,如何利用分布式架构进行全局最大 频繁 项目集 的挖掘,是一个富有实用意义的问题。根据分布式数据库往往具有稀疏性和可归并性的实际特点,本文提出了一种基于事务分类... 林宇关键词:数据挖掘 最大频繁项目集 分布式 大数据 文献传递 基于改进FP-tree的最大 频繁 项目集 挖掘算法 被引量:9 2012年 针对已有算法为了减少PF-tree中路径被重复遍历的次数,需要保存FP-tree中所有频繁 1-项集 的条件模式基的问题,对FP-tree的数据结构进行修改,使得只需要保存FP-tree中每个叶子节点的父节点到根节点路径上项目 组成的条件模式基,降低了保存条件模式基的存储空间开销。在分析最大 频繁 项目集 挖掘算法中搜索空间以及数据表示方法的基础上,通过理论分析和证明,设计了剪枝策略和压缩策略,缩小了算法搜索空间,压缩了FP-tree的规模,提高了算法的执行效率。最后将新算法分别与NHTFPG算法、FpMAX算法进行对比,验证算法的正确性和有效性。实验结果表明,新算法保存FP-tree条件模式基所需要的存储空间不到NHTFPG算法的50%,执行效率比FpMAX算法提高了2~3倍。 马丽生 姚光顺 杨传健关键词:频繁项目集 最大频繁项目集 剪枝策略
相关作者
宋余庆 作品数:219 被引量:1,123 H指数:15 供职机构:东南大学 研究主题:医学图像 数据挖掘 图像分割 关联规则 频繁模式树 朱玉全 作品数:168 被引量:999 H指数:15 供职机构:江苏大学 研究主题:数据挖掘 关联规则 增量式更新 频繁项目集 医学图像 赵群礼 作品数:11 被引量:48 H指数:5 供职机构:合肥师范学院计算机科学与技术系 研究主题:关联规则 最大频繁项目集 频繁模式树 数据挖掘 FP-TREE 李忠哗 作品数:17 被引量:37 H指数:4 供职机构:河北北方学院 研究主题:数据挖掘 关联规则 最大频繁项目集 频繁模式树 最大频繁模式 孙志挥 作品数:187 被引量:2,099 H指数:26 供职机构:东南大学计算机科学与工程学院 研究主题:数据挖掘 关联规则 数据库 频繁模式树 数据流