王晓峰 作品数:23 被引量:98 H指数:5 供职机构: 中国科学院沈阳自动化研究所 更多>> 发文基金: 辽宁省自然科学基金 国家高技术研究发展计划 辽宁省教育厅高等学校科学研究项目 更多>> 相关领域: 自动化与计算机技术 理学 机械工程 文化科学 更多>>
Apriori算法在红外光谱数据挖掘中的应用 被引量:9 2001年 简要地介绍了在大规模数据库中挖掘关联规则的Apriori算法 ,给出了红外光谱数据库知识发现的空间表示方法 ,并根据红外光谱数据挖掘的特点改进了Apriori算法中支持度的计算与频繁集的确定过程 ,运用统计方法把挖掘结果形成可视的特征谱带 -化学基团规则式 ,通过具体的挖掘事例对挖掘结果进行分析与评价。挖掘出的规则式和波谱分析理论比较结果证明了挖掘结果的正确性 。 王晓峰 王晓峰 王天然 尹丹娜关键词:红外光谱 APRIORI算法 数据挖掘 关联规则 分析化学 光谱分析 相关集合与数据挖掘方法研究 数据挖掘是数据库、统计学、人工智能、机器学习等多学科交叉融合的结果,在工业、农业、军事、社会、商业、经济、科学等领域具有广泛的应用价值.该文从认识论出发,以等价类为基础,利用相关集合,提出了相关强度、相关测度、似然关系等... 王晓峰关键词:数据挖掘 关联规则 文献传递 序列模式图及其构造算法 被引量:25 2004年 序列模式挖掘是数据挖掘的一个重要分支 ,在序列事务及有关信息处理中有着广泛的应用 .目前已有许多序列模式模型及相应的挖掘算法 .该文在对序列模式挖掘问题及挖掘算法进行分析的基础上 ,定义了一种称为序列模式图的序列模式框架 ,用于表示序列模式挖掘过程发现的所有序列模式 .序列模式图是由离散状态的序列集到统一的图结构的桥梁 ,可以将序列模式挖掘结果统一到序列模式图中来 .基于序列模式图进行研究可发现某些结构化的新知识 ,称之为后序列模式挖掘 .文中还给出了序列模式图的有关性质及构造算法 . 吕静 王晓峰 Osei Adjei Fiaz Hussain关键词:序列模式挖掘 数据挖掘 红外光谱谱图库中的数据挖掘 被引量:3 1999年 将 计算机技 术应用 于化学领 域.提出 将目 前正 成为 计算 机界 一大 热 点的 数据 挖掘技 术应用于 红外光谱 ,以产生 特征谱 带 子 结构 相关 性规 则的 方 法,并 给 出表 示产 生的知 识、选择 特征属性 的具体 方法以及 挖掘规则 的具体 算法. 尹丹娜 王晓峰关键词:数据挖掘 红外光谱 论信息通信与教学过程 2000年 随着知识经济时代的来临,教育在社会中的位置越来越重要,教师的作用也越来越大。唐朝思想家韩愈说“师者,所以传道授业解惑也”,这是对教师作用的高度概括,虽历经千载仍不失其精妙。一个教师除了要教育、引导学生如何做人之外,最重要的作用就是传授知识。怎样才能传授好知识达到最佳的教学效果,是每一名教师都非常关心的问题。 仙农(C.E.Shannon)在其《通讯的数学理论》中给出了通信过程的数学描述,提出了信息的经典定义:信息是负熵。 王晓峰 唐忠关键词:教学过程 信息通信 一种自顶向下挖掘长频繁项的有效方法 被引量:38 2004年 Apriori算法已经成为关联规则挖掘中的经典算法 ,被广泛地用于商业决策、银行贷款、金融保险等几乎所有的关联规则挖掘领域之中 该方法是一种自底向上的有效挖掘方法 ,对于长频繁项 (如 10 0个项目 )该方法会遇到非常耗时的巨大计算问题 采用了一种新的自上而下挖掘方法 ,提出了事务项目关联信息表、关键项目、项目约简、投影数据库等新概念 ,利用投影、约简等方法在候选项集生成过程中及时修剪重复分支 ,使算法的实际效率大为提高 ,较好地解决了长频繁项的挖掘问题 通过计算机实验和算法分析证明了这种挖掘方法的有效性和完备性 新算法的计算复杂度与项目集平均约简项长度有关 ,估计为 0 5×M3 N×O(2 S×N′2 ) 其中 ,S为系统在用户给定最小支持度条件下的平均约简项长度 ,N′是数据库所对应关系的元组数 ,N为记录数 ,M为项目集平均长度 对于长频繁项来说S很小 。 王晓峰 王天然 赵越关键词:自顶向下 数据挖掘 关联规则 频繁项 相关集合:集合的相关强度与相似关系 1997年 从集合的相关性及相关强度出发,提出了一种新的集合,相关集合与集合的相似关系.相关集合是等价类的推广,也是关系的一种集合形式表示;而集合的相似关系则是一种模糊关系.它们可用于分析关系的性质、研究知识系统的结构与综合以及模式识别等领域.给出了在传统关系特性分析中的有关定理及在知识表示与加工过程中的应用示例. 王晓峰 赵英基于双空间搜索的频繁项挖掘算法 被引量:1 2003年 频繁项的挖掘是关联规则挖掘的主要问题.针对挖掘频繁项的2种算法:Apriori算法和双空间搜索算法进行描述和分析.最后通过1组实验显示2个算法的比较结果.经实验分析表明:双空间搜索算法是可行的、高效的. 吴江红 王霆 王晓峰关键词:数据挖掘 关联规则 最小支持度 基于双空间搜索的频繁项挖掘方法 被引量:10 2002年 1引言
1998年Roberto J.和Bayardo Jr.[7]利用自底向上搜索和项目集排序的方法建立了一种挖掘长型频繁项的Max-Miner算法;Lin D.和Z.Kedem[6]提出了一种双向钳形搜索Pincer-Search方法,利用自底向上搜索产生的非频繁项集来约束和修剪自顶向下方向的最大候选频繁项集,候选频繁项集来自于Apriori方法.这两种方法虽然细节有所不同,但修剪最大频繁项的思想类似. 王晓峰 王天然关键词:数据库 数据挖掘 数据结构 基于相关集合的数据挖掘理论基础研究 被引量:4 2003年 The plausibility relation which is generalization of fuzzy relation and probabilistic relation is proposed in thepaper. We think data mining to be a process of finding the plausibility relation in database and correlativity measure tobe a particular plausibility relation based on correlativity sets. The critical calculates such as the accuracy of the roughsets, the confidence and the bayesian form in data mining can be united using the correlativity measure. The GPDM(General Process of Data Mining)that represents the nature of data mining is also proposed. The data mining theoreti-cal foundation and frameworks based on correlativity sets are also given and discussed in the paper. 王晓峰 王天然关键词:数据库 数据挖掘 知识发现