搜索到1532篇“ WEB日志挖掘“的相关文章
Web日志挖掘被引量:52
2002年
提出了一种新颖的MBP算法 ,它利用关联规则挖掘发现的频繁项目集以加快速度 ,能找出所有满足阀值约束的频繁浏览路径 ,该算法是很有效的 .同时 ,针对Web浏览和日志文件固有的模糊性和不确定性 ,还讨论了Web页面的模糊聚类问题 .最后 。
宋爱波胡孔法董逸生
关键词:WEB日志数据挖掘模糊聚类推荐系统自适应WEB站点
基于Web日志挖掘的网络用户行为交互式可视化分析
2023年
高校在校大学生用户群体的网络行为分析是一个有着普遍需求和意义的重要课题,具有丰富的现实意义与社会价值。本文提出网络用户行为交互式可视化分析方法,研究分析高校大学生用户群体网络行为的特征和兴趣。首先获取某高校真实的网络用户访问日志;其次通过清洗缺省值、去重、规范化等数据预处理方法,选取日期、时间、用户账号和访问地址作为特征属性,并在数据集中标记出每个URL的主题分类和每个用户所属的学院等属性;然后从用户、主题分类、时序3个维度分析得出这些属性的分布情况,发现网络用户行为的区别和联系;最后利用ECharts交互式可视化工具展示分析结果。实验结果反映出当前大学生用户的网络行为特征及兴趣喜好,揭示了大学生用户的网络行为模式,为教学管理者的决策提供了数据支持。
刘翼高明田亮亮严都力韦雨萌李凯茵张博欣
关键词:网络用户行为主题分类高校学生
基于改进的AP聚类算法并行化研究及其在Web日志挖掘中的应用
在这个数字化时代,新的技术、应用和平台层出不穷,不断推动着互联网的发展。与此同时,Web日志的数据量也在与日剧增,其中也包含着大量的冗余信息。如何准确地利用聚类算法从Web日志挖掘出潜在的有价值的信息,就成为了我们需要...
陈御亮
关键词:WEB日志数据挖掘相似度矩阵
基于用户访问树的分布式Web日志挖掘算法被引量:2
2021年
为了提高对分布式Web日志数据的准确挖掘能力,提出基于用户访问树的分布式Web日志挖掘算法。构建分布式Web日志的信息分布式检测模型,采用模糊信息粗糙集调度方法进行分布式Web日志信息的结构重组,提取分布式Web日志的统计特征量,采用用户访问树特征聚类方法进行分布式Web日志数据的空间分布式重组,结合粗糙集特征匹配方法进行分布式Web日志的离散融合处理,对多层分布式数据库中的主成分特征分量进行关联规则融合,结合信息融合结果进行分布式Web日志数据的特征参量聚集式调度,提取分布式Web日志的谱特征分量,采用空间信息聚类方法,实现分布式Web日志的用户访问树模型构造,结合决策树模型构建分布式Web日志挖掘的适应度参数,实现分布式Web日志挖掘。仿真结果表明,采用该方法进行分布式Web日志挖掘的准确性较高,抗干扰性较好,提高了分布式Web日志挖掘和用户信息访问能力。
陈宝国宋旸
关键词:分布式WEB日志挖掘
基于模糊聚类的分布式Web日志挖掘方法被引量:3
2020年
为了提高分布式Web日志挖掘能力,提出基于模糊聚类的分布式Web日志挖掘方法.构建分布式Web日志的关联规则分布集,采用模糊信息聚类分析方法进行分布式Web日志关联规则特征聚类处理,提取分布式Web日志性的多重关联特征量,结合重叠性迭代检测方法进行分布式Web日志挖掘过程中的自适应寻优,采用模糊关联规则调度方法进行分布式Web日志挖掘的负载均衡调度.通过计算邻接点的适应度函数,对相似度高的分布式Web日志关联规则进行合并处理,根据模糊信息聚类结果实现分布式Web日志挖掘优化.仿真结果表明,采用该方法进行分布式Web日志挖掘的精度较高,提高了分布式Web日志的推荐和信息检索能力.
陈宝国宋旸
关键词:关联规则模糊聚类分布式WEB日志
基于云计算的Web日志挖掘模块设计被引量:3
2019年
文章介绍了基于云计算的Web日志挖掘技术的基本流程,同时对Web日志挖掘的数据源、数据类型的深入研究与分析,有针对性地进行了数据挖掘过程中每个具体模块的详细设计,并利用Java语言对基于云计算Hadoop平台的Web日志挖掘系统进行了实现设计。
彭亚
关键词:云计算WEB日志
基于Apriori算法的高校Web日志挖掘系统构建被引量:4
2019年
伴随高校信息化建设工作的深入推进,网站已成为学校管理人员与师生交流沟通的有力媒介,也是外部人员全面了解学校情况的关键平台。鉴于部分高校网站结构复杂、页面链接设计不够合理,导致高校师生获取相关资源效率下降、浏览兴趣匮乏等问题,设计并实现了基于Apriori算法的高校Web日志挖掘系统。同时,通过挖掘原始Web日志,得到高校师生频繁访问路径信息,明确网站内页面间呈现的潜在关联关系,进而掌握高校师生的浏览习惯和站点整体访问情况,为站点结构调整及页面链接优化提供依据,为后续网站构建和优化提供有效的信息参照。
王春玲李川李想
关键词:WEB日志挖掘APRIORI算法关联规则数据预处理
一种改进K-Means算法的Web日志挖掘技术的研究
随着互联网和信息技术的快速发展,从云服务上获取知识成为了人们学习的重要途径,同时,不断涌现出的各种云服务应用使得服务器存储的数据量急剧增加。Web日志作为云端应用的重要组成部分,大量有用的知识和待挖掘的信息被存储在其中,...
陈洲
关键词:WEB日志数据挖掘云计算K-MEANS算法
Web日志挖掘中的数据预处理研究被引量:2
2018年
本文首先在“信息爆炸”的时代背景下提出数据挖掘和Web数据挖掘的重要性,然后针对Web日志挖掘详细讨论了其数据预处理的主要步骤及其过程方法,最后阐述了Web日志挖掘在网站建设上的应用,为后继研究提供了参考。
于琦
关键词:数据挖掘WEB日志挖掘数据预处理
基于Apriori算法的高校Web日志挖掘系统研建
伴随高校信息化建设工作的深入推进,更多的高校开始构建与自身发展实际相一致的数字化网站。数字化网站已经发展为学校管理人员与师生实现交流沟通的有力媒介,也是外部人员全面了解学校情况的关键平台。因此,高校网站设计合不合理直接影...
李川
关键词:WEB日志挖掘APRIORI算法关联规则数据预处理

相关作者

杨炳儒
作品数:393被引量:2,410H指数:25
供职机构:北京科技大学
研究主题:数据挖掘 知识发现 粗糙集 属性约简 KDD
习慧丹
作品数:13被引量:32H指数:3
供职机构:黔南民族师范学院计算机与信息学院
研究主题:WEB日志挖掘 概念格 关联规则 WEB挖掘 日志挖掘
陆丽娜
作品数:22被引量:589H指数:9
供职机构:西安交通大学
研究主题:数据挖掘 WEB日志挖掘 数据库 WEB 专家系统
杨怡玲
作品数:11被引量:363H指数:6
供职机构:上海交通大学电子信息与电气工程学院计算机科学与工程系
研究主题:数据挖掘 WEB日志挖掘 日志挖掘 WEB 数据库
王丽娜
作品数:40被引量:85H指数:6
供职机构:郑州大学
研究主题:数据挖掘 WEB日志挖掘 萘啶 荧光识别 供应商选择