搜索到5723篇“ 分布式数据挖掘“的相关文章
基于云计算的企业管理分布式数据挖掘系统设计
2025年
随着企业规模的扩大和业务的复杂化,企业内部积累了海量的数据,这些数据规模庞大,通过分布式数据挖掘,企业可以更加高效地利用数据资源,为此研究基于云计算的企业管理分布式数据挖掘系统设计。该系统在硬件上采用固态硬盘(SSD)和负载均衡器,确保数据处理速度快、延迟低且负载均衡。在软件上,首先,通过实施分布式数据预处理策略,降低数据复杂性。其次,建立分布式数据挖掘关联规则,以发现数据间的潜在关系。最后,设计基于云计算的分布式数据挖掘算法,利用云计算的强大计算能力实现数据挖掘。应用结果充分验证了基于云计算的企业管理分布式数据挖掘系统的优秀性能,该系统设计合格,能够满足企业管理中分布式数据挖掘的各项需求。
洪亚红
关键词:云计算企业管理分布式数据数据挖掘数据挖掘系统
一种分布式数据挖掘任务调度方法及系统
本说明书实施例公开了一种分布式数据挖掘任务调度方法及系统。该方法包括步骤:读取目标数据挖掘任务划分出的多个可并行执行的数据处理任务;读取所述数据处理任务的代码,识别所述代码中的数据库查询语句,执行所述数据库查询语句获得结...
夏良标 温建梅 夏立乘
一种分布式数据挖掘任务调度方法及系统
本说明书实施例公开了一种分布式数据挖掘任务调度方法及系统。该方法包括步骤:读取目标数据挖掘任务划分出的多个可并行执行的数据处理任务;读取所述数据处理任务的代码,识别所述代码中的数据库查询语句,执行所述数据库查询语句获得结...
夏良标温建梅夏立乘
基于网络平台的分布式数据挖掘系统研究与设计
2024年
本文致力于研究与设计基于网络平台的分布式数据挖掘系统,以应对大数据时代下海量数据的处理与分析挑战。研 究对象为分布式数据挖掘算法及其在网络平台上的集成应用,旨在通过优化算法与系统设计,提升数据挖掘的效率与准确性。研 究首先梳理了分布式计算与数据挖掘的基础理论,进而提出了系统的架构设计,包括数据采集、预处理、分布式挖掘及结果展示等 模块。通过采用并行化策略与迭代优化方法,实现了高效的数据挖掘。本研究不仅丰富了数据挖掘领域的理论体系,也对大数据 分析与智能决策的实践应用具有重要意义。
李鑫
关键词:分布式数据挖掘系统网络平台
一种面向分布式数据挖掘工作流的调度系统
本发明公开了一种面向分布式数据挖掘工作流的调度系统,包括执行终端、节点交换机模块、接入交换机模块、数据检索单元、地址检索单元、对比查询单元、数据库和自动执行模块,每个执行终端的输出端均通讯连接有节点交换机模块,本发明结通...
王涛罗丹玲严志
基于差分隐私的分布式数据挖掘方法研究
随着数据采集和共享技术的发展,采集分布在不同终端上的业务数据进行分析建模已成为大数据挖掘的重要形式。然而这些终端可能分属不同的机构,彼此互不信任。随着人们对数据隐私的日益关注,如何在保护各个终端数据隐私的前提下,挖掘全局...
仲跃
关键词:决策树
一种基于Spark分布式数据挖掘算法封装与调参方法
本发明提供一种基于Spark分布式数据挖掘算法封装与调参方法,对spark机器学习算法抽象出四类通用参数,基于算法配置,完成抽象参数针对性赋值;根据数据存储、算法设置和应用场景,将同一种算法的数据输入参数、算法参数和算法...
袁为捷敬习飞查文杰康书恒潘孙翔
一种面向分布式数据挖掘工作流的调度系统
本发明公开了一种面向分布式数据挖掘工作流的任务调度系统,涉及数据挖掘领域,包括功能模块、搜索模块、控件模块、画布模块,各个模块在所述系统的用户界面包括功能模块对应的功能区,搜索模块对应的搜索区,控件模块对应的控件区,画布...
李晖李一水周彧
基于判断聚合的分布式数据挖掘分类算法研究被引量:12
2020年
随着互联网的发展和云计算技术的广泛应用,许多数据存储在不同的服务器上,分布式数据挖掘技术应运而生。智能agent在各自的站点上得到部分挖掘结果,分布式数据挖掘可以将这些部分的挖掘结果聚合成为全局的结果。文中主要处理的是分布式数据挖掘过程中的分类问题,针对一些特征的数据分别存储于不同的数据源上,提出了一种基于判断聚合模型的分类算法。该算法中每一个agent要对一个案例属于某一个目标类的可能性进行判断,然后利用判断聚合模型将这些agent的判断进行聚合,形成全局的分类结果。基于判断聚合模型的分类算法将逻辑和社会选择理论的技术应用于解决分布式数据挖掘的分类问题,这种新的算法不需要大规模地传输和转化数据,节省了传输成本,提高了分类效率,同时有效地保护了数据的安全性。
李莉
关键词:分布式数据挖掘多主体系统逻辑
一种基于数据去重的分布式数据挖掘与统计方法
本发明公开了一种基于数据去重的分布式数据挖掘与统计方法,分布式服务器集群遍历数据包所有数据,并根据用户配置的数据聚合挖掘条件,分布式服务器集群中各个服务器节点分别判断数据是否重复,若不重复则保留,否则删除重复多余的数据。...
邓金祥王炜代先勇谷峰曾海刚佘朝裕刘洋

相关作者

杨炳儒
作品数:393被引量:2,410H指数:25
供职机构:北京科技大学
研究主题:数据挖掘 知识发现 粗糙集 属性约简 KDD
张克君
作品数:46被引量:135H指数:7
供职机构:北京电子科技学院
研究主题:分布式数据挖掘 分布式WEB 数据挖掘 WEB日志挖掘 加密
吉根林
作品数:187被引量:1,833H指数:20
供职机构:南京师范大学
研究主题:数据挖掘 视频 聚类 异常检测 关联规则
赵斌
作品数:60被引量:257H指数:8
供职机构:南京师范大学
研究主题:关联规则 视频 异常事件检测 大数据 异常检测
孙志挥
作品数:187被引量:2,099H指数:26
供职机构:东南大学计算机科学与工程学院
研究主题:数据挖掘 关联规则 数据库 频繁模式树 数据流