搜索到24450篇“ 不平衡数据集“的相关文章
面向平衡数据的边坡稳定性智能预测研究
2025年
输电线路沿线边坡稳定性对保障电网工程安全具有重要的工程意义,必须采用准确的方法来预测边坡的稳定性.基于三种采样技术建立了面向平衡数据的边坡稳定性预测模型,满足了边坡工程中高精度、快速性、稳定性预测的要求。首先,选择坡高、坡角、容重、土体内摩擦角、黏聚力和孔隙水压力比作为预测变量建立了边坡稳定性预测案例库;然后,基于SMOTE、Tomek links以及SMOTE-Tomek技术对训练数据进行采样,有效地解决数据平衡的问题;最后选用随机森林模型对边坡的稳定性进行分类预测,采用混淆矩阵、准确率、精确率、召回率、F1值等评价指标对模型分类能力进行评价。结果表明,SMOTE-Tomek模型预测效果最佳。本研究的成功实施可以提高边坡稳定性预测的准确性,为边坡工程设计和施工提供科学依据。
刘强孙才华范小光剧成宇
关键词:边坡稳定性不平衡数据
一种基于生成对抗网络的平衡数据的预测方法
本发明公开了一种基于生成对抗网络的平衡数据的预测方法,过程为:接收预测请求;采数据,形成数据,明确数据中的特征与标签及少数类样本和多数类样本的数量;将数据中的非数值特征列以及标签列转变为分类数值;将处理的数据...
王竹荣牛亚邦黑新宏
平衡数据的DC-SMOTE过采样方法
2024年
针对平衡数据在分类任务中表现佳的问题,提出基于局部密度与中度的过采样算法。针对数据中所有的少数类样本点,分别利用高斯核函数与局部引力来计算局部密度与中度;对于局部密度较小的部分有针对性地合成第一类新样本,解决类内平衡问题。根据中度的同,区分出少数类样本的边界,有针对性地合成第二类新样本,达到强化边界的作用;同时,通过自适应生成新样本,有效解决大部分过采样算法没有明确过采样量或者盲目追求样本平衡度相等的问题。最后,在公开的12个平衡数据上进行了实验,实验结果表明,本算法在低平衡数据与高平衡数据上的应用均拥有良好的表现。
冀常鹏尚佳奇代巍
关键词:不平衡数据集过采样高斯核函数不平衡度
二分类平衡数据平衡处理方法、装置、设备及介质
本申请公开了一种二分类平衡数据平衡处理方法、装置、设备及介质,涉及数据处理技术领域,包括获取工业生产活动中存在二分类平衡问题的数据,对数据进行数据点划分及异常点筛选;将单面选择欠采样方法和Borderline...
胡素霞王娜王波程占刚潘曦
一种基于WGAN训练收敛的平衡数据分析方法
本发明公开了一种基于WGAN训练收敛的平衡数据分析方法,针对平衡数据中的少类样本构建包含生成器和判别器的WGAN模型。生成器生成数据,再利用判别器对生成的新数据和原始数据进行判断,进而将判别结果以代价的形式反馈给...
许艳萍裘振亮章霞叶挺聪仇建张桦吴以凡张灵均陈政
基于改进决策树的平衡数据分类算法研究被引量:1
2024年
平衡数据中各类样本数量均,导致分类模型难以训练。针对平衡数据分类模型稳定性差,准确率低的问题,提出一种基于改进C4.5决策树数据分类算法,通过融合SMOTE优化采样算法,构建出N_C4.5-IDC平衡数据分类模型。模型首先利用K-Means聚类对数据进行状态分布分析,并使用SMOTE采样法进行混合采样,通过增加人为样本点提高少数类样本数,对数据进行平衡处理;然后对C4.5决策树的核心信息增益率模型进行简化改进,提高特征选择效率,并采用回缩损失对比的方法对决策树进行后剪枝处理,构建单一N_C4.5决策树模型;最后将多组N_C4.5模型进行组合叠加,采用加权处理的方法构建N_C4.5-IDC模型。消融实验数据结果表明:优化策略的叠加能显著提高模型性能指标。对比实验数据结果表明:与基线分类算法相比,所提算法准确率最高达96.81%,召回率提高了6.15%,综合性能上升了5.66%。综上,基于改进C4.5决策树构建的平衡数据分类模型在平衡数据的同时,提高了分类的稳定性与准确性。
陈婷谢志龙
关键词:不平衡数据集
基于WGAN动态惩罚的网络安全平衡数据分析方法
本发明公开了基于WGAN动态惩罚的网络安全平衡数据分析方法,针对平衡数据中的少类样本构建WGAN模型。在判别器损失函数中添加一项惩罚项,约束损失函数的梯度范数,惩罚项在真实数据分布上叠加一个随机分布作为过渡分布,...
许艳萍裘振亮仇建叶挺聪张桦吴以凡张灵均陈政
一种基于动态多目标种子优化算法的平衡数据处理方法
本发明涉及一种基于动态多目标种子优化算法的平衡数据处理方法,与现有技术相比解决了平衡数据问题求解性能差、效率低的缺陷。本发明包括以下步骤:原始平衡数据的分割;静态多目标优化算法的初始化;基于代理预测模型的初始...
张晓明谢乐乐程洪伟李俊田野
一种平衡数据的扩充方法、装置及存储介质
本发明公开了一种平衡数据的扩充方法、装置及存储介质,涉及数据增强技术领域,将故障数据输入基于VAE‑GAN的改进网络,得到若干新生成的故障数据;将所述若干新生成的故障数据加入平衡数据,得到平衡数据;其中,所述基...
荆晓远杜杰宾邓晋珏廖珂刘飞
平衡数据梯度提升算法研究
2024年
随着机器学习在各个领域的应用断扩大,处理平衡数据的挑战越发显著。平衡数据的问题在医学诊断、信用欺诈检测和工业质检等领域广泛存在,提高对平衡数据的处理能力至关重要。本文构建XGBoost、LightGBM和CatBoost三种预测分类模型,通过调整参数,使用AUC值作为评分标准,并对比各分类模型在该数据上的表现情况。
杨森罗立帆刘桓竭曾求初
关键词:不平衡数据集

相关作者

张化祥
作品数:251被引量:346H指数:9
供职机构:山东师范大学
研究主题:图像 聚类 模态 网络 多视图
杨智明
作品数:98被引量:230H指数:6
供职机构:哈尔滨工业大学
研究主题:模拟电路 故障数据 故障诊断 扫描链 故障特征
卢诚波
作品数:47被引量:86H指数:5
供职机构:丽水学院
研究主题:超限 学习机 循环矩阵 不平衡数据集 隐层
赵小强
作品数:244被引量:647H指数:11
供职机构:兰州理工大学
研究主题:故障诊断 故障检测 滚动轴承 数据挖掘 化工过程
张涛
作品数:5被引量:81H指数:4
供职机构:西安建筑科技大学信息与控制工程学院
研究主题:不平衡数据集 不平衡 数据集分类 支持向量机 遗传算子