搜索到8064篇“ 不平衡数据“的相关文章
基于动态K均值聚类的平衡数据分类
本发明提供了一种基于动态K均值聚类的平衡数据分类方法,旨在解决机器学习领域中常见的类别平衡问题。该方法通过自适应k‑means聚类算法对多数类数据集进行聚类,自动调整聚类的数量(K值),以适应数据的分布特性。在聚类完...
万静陈弈名司禹
一种样本平衡数据处理诊断系统及方法
本发明公开了一种样本平衡数据处理诊断系统及方法,包括数据导入模块、样本分类模块、样本数求均模块、样本平衡模块和数据分析模块,数据导入模块上连接有样本分类模块,样本分类模块上连接有样本数求均模块,样本数求均模块,样本数求...
刘泽王海蔡英凤张榜玲罗汞伟赛影辉董钊志宋廷伦钟益林
一种基于多标签平衡数据分类的疾病预测方法
本发明属于疾病预测技术领域,具体涉及一种基于多标签平衡数据分类的疾病预测方法;该方法包括:获取带多种标签的医疗数据并对其进行预处理,得到预处理好的医疗数据;将医疗数据划分为各标签下的跨边界样本、自边界样本和内部样本;计...
苏祖强吴旗于洪胡峰王国胤
一种基于自平衡联邦学习的平衡数据故障诊断方法
本发明公开了一种基于自平衡联邦学习的平衡数据故障诊断方法,属于人工智能和边缘计算相结合的技术领域,包括以下步骤:S1、获取客户端数据并监控客户端数据是否存在平衡现象;S2、数据增强;S3、共享生成器与判别器的权值;S...
李骏廖振伟夏鹏程倪艺洋时龙
面向平衡数据集的边坡稳定性智能预测研究
2025年
输电线路沿线边坡稳定性对保障电网工程安全具有重要的工程意义,必须采用准确的方法来预测边坡的稳定性.基于三种采样技术建立了面向平衡数据集的边坡稳定性预测模型,满足了边坡工程中高精度、快速性、稳定性预测的要求。首先,选择坡高、坡角、容重、土体内摩擦角、黏聚力和孔隙水压力比作为预测变量建立了边坡稳定性预测案例库;然后,基于SMOTE、Tomek links以及SMOTE-Tomek技术对训练数据进行采样,有效地解决数据平衡的问题;最后选用随机森林模型对边坡的稳定性进行分类预测,采用混淆矩阵、准确率、精确率、召回率、F1值等评价指标对模型分类能力进行评价。结果表明,SMOTE-Tomek模型预测效果最佳。本研究的成功实施可以提高边坡稳定性预测的准确性,为边坡工程设计和施工提供科学依据。
刘强孙才华范小光剧成宇
关键词:边坡稳定性不平衡数据
基于SFE的平衡数据二阶段特征选择算法
2025年
数据处理领域,高维特征与类别平衡问题已成为诸多研究面临的棘手挑战。鉴于此,文章以SFE算法作为坚实基石,创新性地提出了一种专门面向平衡数据情境的二阶段特征选择算法——SFE-TSFS(a two-stage feature selection algorithm for imbalanced data based on SFE)。首先,针对SFE算法未能处理类别平衡的局限,SFE-TSFS引入了Borderline-SMOTE方法生成符合要求的边界样本,以平衡数据分布。其次,为加速算法收敛并降低计算成本,在初始特征筛选阶段结合了模糊互信息方法,有效去除大量冗余特征。实验结果表明,与原SFE算法相比,文章所提出的算法在保证分类准确率的同时,运行时间和特征数量上均优于SFE算法,验证了SFE-TSFS算法的有效性。
沈先倩杨盛毅陈静何小飞程俞富
关键词:高维数据不平衡数据
一种面向分布式共享类平衡数据的分类方法
本发明涉及数据分类技术领域,尤其涉及一种面向分布式共享类平衡数据的分类方法,首先基于联邦学习框架学习一个已收敛的基本全局模型,然后利用弹性权重固化方法使每个本地模型在遗忘前一轮全局模型中重要信息的情况下进一步学习本...
袁晓涵孙川陈蜀宇王国芬徐欣张译房爱青冯金旺
全基因组关联研究中极端平衡数据的统计分析方法(二)
2025年
极端平衡数据定义为自变量或因变量指标的取值呈现严重比例失衡的数据,在此情境下,参数模型假设检验的经典统计量明显偏离大样本下的理论分布,导致第一类错误膨胀。超大型人群队列全基因组资源的日益共享使得高效准确处理极端平衡数据的统计需求日益突出,也推动了遗传统计方法的发展。本文介绍当前全基因组关联研究中2种常用处理极端平衡数据的校正方法:Firth校正方法和鞍点近似方法,并通过模拟实验展示其可有效控制第一类错误,最后,简单介绍极端平衡基因组学数据常用分析软件。本文为研究者对极端平衡数据的统计分析提供理论参考和应用推荐。
谢宁毕文健张中文邵方魏永越赵杨赵杨陈峰
关键词:全基因组关联研究
多判别器生成对抗网络工业平衡数据建模方法
2025年
为解决工业场景下平衡数据建模预测精度较低的问题,提出结合多判别器生成对抗网络及反聚类筛选的工业平衡数据建模方法来增强模型分类预测效果。针对生成对抗网络模型在训练过程中存在模式崩溃,导致生成数据多样性差的问题,基于集成思想,使用多判别器框架改进Wasserstein生成对抗网络,增强模型对模式崩溃问题的鲁棒性;针对生成数据存在噪声的问题,集成有序点集识别聚类结构算法和高斯混合模型聚类算法从密度及分布角度对生成数据进行聚类,采用信息熵反向筛选生成数据扩充少数类样本;在电极升降数据集及UCL带钢缺陷数据集上采用XGBOOST、支持向量机、BP神经网络3种分类模型对比原始平衡数据、随机过采样、SMOTE算法、原始生成对抗网络与所提方法解决平衡问题后模型的分类预测效果。实验验证了所提方法的优越性。
赵佳杨澜刘勤学
关键词:信息熵矿热炉电极升降
面向平衡数据的短期风功率联邦学习分布式预测方法
本发明公开了一种面向平衡数据的短期风功率联邦学习分布式预测方法,涉及电力系统的人工智能应用领域。通过四分位法和三次样条插值法对区域多风电场数据集中的异常数据进行清洗;基于VMD‑TPA‑LSTM算法构建联邦学习框架下的...
牛哲文郑杰冀岳兰松岩董瑞康韩肖清党志芳武宇翔

相关作者

赵小强
作品数:244被引量:647H指数:11
供职机构:兰州理工大学
研究主题:故障诊断 故障检测 滚动轴承 数据挖掘 化工过程
刘三阳
作品数:746被引量:3,405H指数:27
供职机构:西安电子科技大学
研究主题:支持向量机 英文 无线传感器网络 多目标规划 集值映射
蒋盛益
作品数:169被引量:939H指数:17
供职机构:广东外语外贸大学
研究主题:聚类 数据挖掘 存储介质 聚类算法 印尼语
高欣
作品数:230被引量:903H指数:15
供职机构:北京邮电大学
研究主题:电力调度 异常检测 监控数据 空间机械臂 智能电表
何田中
作品数:15被引量:21H指数:3
供职机构:闽南师范大学
研究主题:数据挖掘 不平衡数据 ROUGH集 关联分类算法 抽取技术