搜索到930篇“ 属性重要度“的相关文章
监督邻域粗糙集下基于标准差属性重要的启发式算法
2025年
作为粗糙集理论中的重要模型,监督邻域粗糙集因其良好的区分性能而备受关注。然而,当在监督邻域粗糙集上进行约简时,因为重复计算候选属性重要,大多数的搜索都会导致巨大的时间消耗。为解决这一问题,提出了基于标准差属性重要的启发式算法。该算法通过样本的离散程属性重要进行排序,以此来减少计算约简过程中候选属性的遍历次数。12组UCI数据集上的实验结果表明,与其余三种算法相比,基于标准差属性重要的启发式算法所求约简的分类性能得到了提高,同时时间消耗有着显著减少。
刘旭东
关键词:属性约简属性重要度标准差
基于正区域和投票式属性重要的特征提取算法
2024年
高维数据集中的不相关或冗余信息导致特征提取计算复杂较高的问题,已成为研究者关注的热点。邻域粗糙集模型具有通过删除大规模数据中的冗余信息来提高计算效率方面的优势,为进一步提升现有邻域粗糙集模型在处理连续型高维数据库的特征提取过程中的计算效率,提出一种基于正区域和投票式属性重要的特征提取算法。该算法首先依据属性约简前后正区域不变的性质,以及属性约简与正区域内决策划分类的类内归并和类间区分之间的本质联系,改进了投票式属性重要计算办法;然后从域间区分、类间区分以及类内区分三个方面,融入属性阈值来评估条件属性重要,以此减少不同分布密的条件属性给投票结果带来的距离影响;最后,通过一次性投票的方式给出所有的条件属性重要,将条件属性重要计算从k维降至1维,以此降低计算的复杂。实验分析验证了新提出的算法对于提高属性重要计算效率效果显著,在实验的7个UCI测试数据集上的分类精以及运行时间等方面表现良好。
骆公志张尚蕾
关键词:邻域粗糙集属性重要度正区域投票策略特征提取
基于均值属性重要的启发式方法
本发明公开了一种基于均值属性重要的启发式方法,其为求解属性约简的启发式算法。在监督邻域粗糙集中传统启发式算法求解约简时往往需要计算所有候选属性重要,这会产生巨大的时间消耗。为解决这一问题,本发明设计了一种均值属性重...
刘旭东
基于知识粒-属性重要的水资源可持续利用评价--以北京市为例被引量:2
2023年
北京市人口密集而区域水资源量有限,水资源的不合理开发利用曾一导致地下水超采、水环境污染等问题,如何评价和促进北京市水资源利用的可持续性是缓解北京市水资源问题的基础。为分析北京市水资源利用现状,根据社会-经济-生态环境复合系统建立评价指标体系,采用知识粒属性重要方法确定指标权重,基于集对分析和属性识别法定量评价了北京市2004~2020年水资源利用的可持续性,对比了不同权重下的评价结果并分析可利用水资源量对可持续性的影响。结果表明:基于知识粒属性重要的赋权方法在评价中具有良好的适用性,不同方法所得评价结果虽略有差异,但整体上体现出的趋势性基本一致,均反映了北京市近17 a来水资源可持续利用水平逐年提高,呈现良性发展态势。同时,可利用水资源量是影响北京市水资源利用可持续性的重要因素,而南水北调中线工程为保证北京市可利用水资源量提供了有利条件。研究成果对北京市未来水资源保护和发展相关政策和规划的制定具有一定的参考价值。
门宝辉吴明明刘灿均刘焕龙
关键词:水资源可持续利用粗糙集知识粒度属性重要度
基于多属性重要加权K-近邻算法的客流量预测研究
2023年
随着数据维的增加,传统k-邻近算法没有考虑不同属性对预测结果的影响,易导致维灾难。为了解决数据维对预测结果的影响问题,提出一种基于多属性重要加权k-邻近算法(Multi-attribute importance weighting,MIW-KNN)。选取影响景区客流量的五个重要属性因素,将景点级别、门票价格、周末或节假日、搜索指数和天气作为样本属性,把景区客流量作为类,利用多维数据属性空间上的对客流量的影响程确定各个数据样本属性的权重,通过多属性加权和欧氏距离进行近邻搜索,进行最优预测。选取5A级景点清明上河园景区为例进行实证分析,结果显示所提模型能很好地提高客流量的预测效果,提高了预测的准确率、在R2、RMSE、MAE和MAPE等方面表现良好。
董淼蒋纬昌王晓茹孙荣荣
关键词:数据挖掘
网络流量数据属性重要排序方法、装置、设备及介质
本发明属于网络信息技术领域,公开一种网络流量数据属性重要排序方法、装置、设备及介质,所述方法包括:获取待处理网络流量数据属性集At;采用弱序关系对网络流量数据属性集At中的属性进行排序,获得定性属性重要排序;采用特征...
崔鑫邓楠轶胥冠军杨东王文庆崔逸群毕玉冰刘超飞王艺杰朱召鹏董夏昕介银娟朱博迪刘迪肖力炀刘骁
基于决策表相容属性重要的连续属性离散化算法被引量:1
2022年
基于粗糙集理论的模型筛选与组合预测方法对于舰船维修费用的预测具有较强的应用价值,然而在连续属性离散化方面却存在部分问题。针对由多种预测模型预测值构成的数据表的离散化及模型筛选问题,分别分析了有监督离散化算法和无监督离散化算法的局限性与适用性,并针对无监督离散化算法可能改变原有不可分辨关系、已有的改进算法可能存在的断点冗余以及分别考虑决策表与条件属性的不相容导致的计算复杂的问题,引入决策表相容作为反馈信息,从整体上考虑决策表的相容,初次离散化选取数值合理的断点数,并结合各条件属性属性重要对各条件属性进行排序,通过逐次对决策表相容进行判别,依排序情况逐个对条件属性的断点数进行调整,以达到离散化效果并保证决策表的相容不变。通过例证分析,验证了该算法的有效性。
王成宇林名驰
关键词:离散化属性重要度
基于数据与用户的综合属性重要确定方法及系统
本发明属于网络信息技术领域,公开一种基于数据与用户的综合属性重要确定方法及系统;所述方法,包括:获取待处理数据集,所述数据集的全部属性构成属性集{At<Sub>1</Sub>,At<Sub>2</Sub>,……,At<...
崔鑫邓楠轶胥冠军杨东王文庆崔逸群毕玉冰刘超飞朱博迪董夏昕介银娟刘迪肖力炀王艺杰朱召鹏刘骁
一种基于改进邻域粗糙集中属性重要的快速属性约简方法被引量:5
2022年
冗余属性过多是影响分类算法运行效率和准确率的重要因素。为了提高分类算法的运行效率和分类准确率,提出一种基于改进邻域粗糙集属性重要的快速属性约简算法。首先,提出一种改进的KNN属性重要;其次,利用改进过属性重要的邻域粗糙集对原始数据的条件属性进行重要排序,利用排序结果对原始数据进行属性约简,得到约简后的特征子集;最后,将约简后的特征子集输入分类模型进行分类预测。实验仿真结果表明,与改进前的基于邻域粗糙集的属性约简算法相比,所提出的方法具有较高预测精和较快运行速
周长顺徐久成瞿康林申凯丽章磊
关键词:数据处理属性重要度属性约简邻域粗糙集
基于边际属性重要属性权重确定方法及应用
2021年
针对粗糙集属性重要权重确定方法考虑信息不足的问题,定义了多属性组合的边际重要,并提出了基于边际重要的一种属性权重确定方法。利用所得到的权值对K近邻算法的距离进行加权改进,得到的权值定义了KNN算法的距离相似,并用KNN算法的分类效果评价文章所提出的权值确定方法。通过对UCI数据集的验证,改进后的KNN算法有效地提高了分类效果。将文章提出的权重确定方法应用于石化装置旋转机械故障诊断中,对于齿轮箱故障,KNN的分类准确率为75.65%,改进后的KNN算法分类准确率可提高到80.25%。与其他分类算法相比,文章提出的基于权值的改进KNN算法的分类精高于其他分类方法,这对多属性决策问题中属性权重的确定具有一定的参考价值。
王世华张清华胡绍林吴思莹
关键词:粗糙集属性重要度

相关作者

丁卫平
作品数:300被引量:425H指数:10
供职机构:南通大学
研究主题:属性约简 病历 电子病历 粗糙集 眼底
孙立民
作品数:20被引量:71H指数:4
供职机构:广东石油化工学院理学院
研究主题:粗糙集 属性重要度 局部凸空间 矢值测度 有界变差函数
邱桃荣
作品数:104被引量:273H指数:8
供职机构:南昌大学
研究主题:粒计算 粗糙集 信息粒 数据挖掘 卷积神经网络
叶军
作品数:59被引量:182H指数:9
供职机构:南昌工程学院信息工程学院
研究主题:粗糙集 层次分析法 分辨矩阵 计算思维 属性重要度
张清华
作品数:383被引量:2,177H指数:26
供职机构:西南交通大学
研究主题:正交异性钢桥面板 桥梁工程 钢桥面板 粗糙集 粒计算