搜索到8064 篇“ 不平衡数据 “的相关文章
基于动态K均值聚类的不 平衡 数据 分类 本发明提供了一种基于动态K均值聚类的不 平衡 数据 分类方法,旨在解决机器学习领域中常见的类别不 平衡 问题。该方法通过自适应k‑means聚类算法对多数类数据 集进行聚类,自动调整聚类的数量(K值),以适应数据 的分布特性。在聚类完... 万静 陈弈名 司禹一种样本不 平衡 数据 处理诊断系统及方法 本发明公开了一种样本不 平衡 数据 处理诊断系统及方法,包括数据 导入模块、样本分类模块、样本数求均模块、样本平衡 模块和数据 分析模块,数据 导入模块上连接有样本分类模块,样本分类模块上连接有样本数求均模块,样本数求均模块,样本数求... 刘泽 王海 蔡英凤 张榜玲 罗汞伟 赛影辉 董钊志 宋廷伦 钟益林一种基于多标签不 平衡 数据 分类的疾病预测方法 本发明属于疾病预测技术领域,具体涉及一种基于多标签不 平衡 数据 分类的疾病预测方法;该方法包括:获取带多种标签的医疗数据 并对其进行预处理,得到预处理好的医疗数据 ;将医疗数据 划分为各标签下的跨边界样本、自边界样本和内部样本;计... 苏祖强 吴旗 于洪 胡峰 王国胤一种基于自平衡 联邦学习的不 平衡 数据 故障诊断方法 本发明公开了一种基于自平衡 联邦学习的不 平衡 数据 故障诊断方法,属于人工智能和边缘计算相结合的技术领域,包括以下步骤:S1、获取客户端数据 并监控客户端数据 是否存在不 平衡 现象;S2、数据 增强;S3、共享生成器与判别器的权值;S... 李骏 廖振伟 夏鹏程 倪艺洋 时龙面向不 平衡 数据 集的边坡稳定性智能预测研究 2025年 输电线路沿线边坡稳定性对保障电网工程安全具有重要的工程意义,必须采用准确的方法来预测边坡的稳定性.基于三种采样技术建立了面向不 平衡 数据 集的边坡稳定性预测模型,满足了边坡工程中高精度、快速性、稳定性预测的要求。首先,选择坡高、坡角、容重、土体内摩擦角、黏聚力和孔隙水压力比作为预测变量建立了边坡稳定性预测案例库;然后,基于SMOTE、Tomek links以及SMOTE-Tomek技术对训练数据 进行采样,有效地解决数据 不 平衡 的问题;最后选用随机森林模型对边坡的稳定性进行分类预测,采用混淆矩阵、准确率、精确率、召回率、F1值等评价指标对模型分类能力进行评价。结果表明,SMOTE-Tomek模型预测效果最佳。本研究的成功实施可以提高边坡稳定性预测的准确性,为边坡工程设计和施工提供科学依据。 刘强 孙才华 范小光 剧成宇关键词:边坡稳定性 不平衡数据 基于SFE的不 平衡 数据 二阶段特征选择算法 2025年 在数据 处理领域,高维特征与类别不 平衡 问题已成为诸多研究面临的棘手挑战。鉴于此,文章以SFE算法作为坚实基石,创新性地提出了一种专门面向不 平衡 数据 情境的二阶段特征选择算法——SFE-TSFS(a two-stage feature selection algorithm for imbalanced data based on SFE)。首先,针对SFE算法未能处理类别不 平衡 的局限,SFE-TSFS引入了Borderline-SMOTE方法生成符合要求的边界样本,以平衡 数据 分布。其次,为加速算法收敛并降低计算成本,在初始特征筛选阶段结合了模糊互信息方法,有效去除大量冗余特征。实验结果表明,与原SFE算法相比,文章所提出的算法在保证分类准确率的同时,运行时间和特征数量上均优于SFE算法,验证了SFE-TSFS算法的有效性。 沈先倩 杨盛毅 陈静 何小飞 程俞富关键词:高维数据 不平衡数据 一种面向分布式不 共享类不 平衡 数据 的分类方法 本发明涉及数据 分类技术领域,尤其涉及一种面向分布式不 共享类不 平衡 数据 的分类方法,首先基于联邦学习框架学习一个已收敛的基本全局模型,然后利用弹性权重固化方法使每个本地模型在不 遗忘前一轮全局模型中重要信息的情况下进一步学习本... 袁晓涵 孙川 陈蜀宇 王国芬 徐欣 张译 房爱青 冯金旺全基因组关联研究中极端不 平衡 数据 的统计分析方法(二) 2025年 极端不 平衡 数据 定义为自变量或因变量指标的取值呈现严重比例失衡的数据 ,在此情境下,参数模型假设检验的经典统计量明显偏离大样本下的理论分布,导致第一类错误膨胀。超大型人群队列全基因组资源的日益共享使得高效准确处理极端不 平衡 数据 的统计需求日益突出,也推动了遗传统计方法的发展。本文介绍当前全基因组关联研究中2种常用处理极端不 平衡 数据 的校正方法:Firth校正方法和鞍点近似方法,并通过模拟实验展示其可有效控制第一类错误,最后,简单介绍极端不 平衡 基因组学数据 常用分析软件。本文为研究者对极端不 平衡 数据 的统计分析提供理论参考和应用推荐。 谢宁 毕文健 张中文 邵方 魏永越 赵杨 赵杨 陈峰关键词:全基因组关联研究 多判别器生成对抗网络工业不 平衡 数据 建模方法 2025年 为解决工业场景下不 平衡 数据 建模预测精度较低的问题,提出结合多判别器生成对抗网络及反聚类筛选的工业不 平衡 数据 建模方法来增强模型分类预测效果。针对生成对抗网络模型在训练过程中存在模式崩溃,导致生成数据 多样性差的问题,基于集成思想,使用多判别器框架改进Wasserstein生成对抗网络,增强模型对模式崩溃问题的鲁棒性;针对生成数据 存在噪声的问题,集成有序点集识别聚类结构算法和高斯混合模型聚类算法从密度及分布角度对生成数据 进行聚类,采用信息熵反向筛选生成数据 扩充少数类样本;在电极升降数据 集及UCL带钢缺陷数据 集上采用XGBOOST、支持向量机、BP神经网络3种分类模型对比原始不 平衡 数据 、随机过采样、SMOTE算法、原始生成对抗网络与所提方法解决不 平衡 问题后模型的分类预测效果。实验验证了所提方法的优越性。 赵佳 杨澜 刘勤学关键词:信息熵 矿热炉 电极升降 面向不 平衡 数据 的短期风功率联邦学习分布式预测方法 本发明公开了一种面向不 平衡 数据 的短期风功率联邦学习分布式预测方法,涉及电力系统的人工智能应用领域。通过四分位法和三次样条插值法对区域多风电场数据 集中的异常数据 进行清洗;基于VMD‑TPA‑LSTM算法构建联邦学习框架下的... 牛哲文 郑杰 冀岳 兰松岩 董瑞康 韩肖清 党志芳 武宇翔
相关作者
赵小强 作品数:244 被引量:647 H指数:11 供职机构:兰州理工大学 研究主题:故障诊断 故障检测 滚动轴承 数据挖掘 化工过程 刘三阳 作品数:746 被引量:3,405 H指数:27 供职机构:西安电子科技大学 研究主题:支持向量机 英文 无线传感器网络 多目标规划 集值映射 蒋盛益 作品数:169 被引量:939 H指数:17 供职机构:广东外语外贸大学 研究主题:聚类 数据挖掘 存储介质 聚类算法 印尼语 高欣 作品数:230 被引量:903 H指数:15 供职机构:北京邮电大学 研究主题:电力调度 异常检测 监控数据 空间机械臂 智能电表 何田中 作品数:15 被引量:21 H指数:3 供职机构:闽南师范大学 研究主题:数据挖掘 不平衡数据 ROUGH集 关联分类算法 抽取技术