王向阳
- 作品数:3 被引量:15H指数:1
- 供职机构:西安邮电大学通信与信息工程学院更多>>
- 相关领域:自动化与计算机技术更多>>
- 基于XML数据挖掘的Apriori算法的研究与改进被引量:13
- 2016年
- XML以其诸多优点,迅速成为不同领域间信息表示与交换的标准;大量XML数据的出现给数据挖掘带来了新的挑战;挖掘XML数据关联规则的大部分工作都是基于Apriori算法的研究;对Apriori算法的基本方法与效率进行了分析,指出其不足,并提出了改进的XApriori算法,该算法基于新的数据结构,利用Hash表的存储技术以及对Apriori算法的优化来提高查找频繁项集的效率;对Apriori算法和XApriori算法进行了比较,实验结果表明改进的XApriori算法优于Apriori算法。
- 张继荣王向阳
- 关键词:数据挖掘关联规则频繁项集APRIORI
- 基于Hadoop的海量小型XML数据挖掘的研究
- 目前,随着“互联网+”时代的到来,各行各业都将传统行业和互联网进行整合,来达到产业的升级换代,由此必然会产生海量的互联网数据。XML可以在不同平台间进行数据的表示、存储和交换,因此XML数据在互联网数据中占据了绝大多数。...
- 王向阳
- 关键词:海量数据XML格式数据挖掘HADOOP平台
- 文献传递
- 基于垂直事务关系的快速Apriori算法被引量:1
- 2017年
- 针对Apriori算法需要多次扫描数据库的缺陷,提出一种基于垂直事务关系的改进算法XApriori。该方法对原始事务数据库扫描后,采用项集事务垂直对应关系的位集合数据存储结构,并构建逻辑生成候选项集策略,利用数值统计的方法生成候选项集并确定频繁项集,实现关联规则的挖掘。对比实验结果表明,改进算法比Aprior算法关联规则挖掘的效率有所提高。
- 杨瀚涛王向阳
- 关键词:数据挖掘关联规则频繁项集APRIORI算法