搜索到824篇“ 属性选择算法“的相关文章
- 噪音数据的属性选择算法
- 2021年
- 正则化属性选择算法减小噪音数据影响的效果不佳,而且样本空间的局部结构几乎没有被考虑,在将样本映射到属性子空间后,样本之间的联系与原空间不一致,导致数据挖掘算法的效果不能令人满意.提出一个抗噪音属性选择方法,可以有效地解决传统算法的这两个缺陷.该方法首先采用自步学习的训练方式,这不仅能大幅度降低离群点进入训练的可能性,而且有利于模型的快速收敛;然后,采用加入l2,1正则项的回归学习器进行嵌入式属性选择,兼顾“求得稀疏解”和“解决过拟合”,使模型更稳健;最后,融合局部保留投影的技术,将其投影矩阵转换成模型的回归参数矩阵,在属性选择的同时保持样本之间的原有局部结构.采用一系列基准数据集合测试该算法,在aCC和aRMSE上的实验结果,表明了该属性选择方法的有效性.
- 许航张师超吴兆江李佳烨
- 关键词:局部保留投影
- 基于双稀疏表示的无监督属性选择算法
- 2021年
- 由于大量无类标签数据需要降维处理,近年来无监督属性选择学习受到越来越多的关注。通过将两种稀疏表示和属性自表达损失函数嵌入到同一个学习框架中,提出了一种新的无监督属性选择算法。首先,利用属性自表达技术重构数据,使每一重构属性为所有原始属性的线性表征,加强属性关联性。然后,分别利用l_(2, p)范数正则项和l_(1)范数正则项使权重系数矩阵稀疏,剔除冗余无关属性,实现属性选择目的。最后,将约简后的低维数据集送入支持向量机中获得分类结果,以此评判属性选择算法是否有效。对多个真实数据集进行实验,实验结果显示,所提算法的降维效果优于一般常用算法。
- 劳翠金秦燊文国秋
- 基于互信息的多标记学习流特征与类属属性选择算法研究
- 随着计算机科学与技术不断发展,我们在生活中面对着各式各样的数据。其中许多数据是同时被多个标记所描述的,这样的数据被称为多标记数据,也是多标记学习任务的研究对象。多标记学习是根据大量已有的多标记数据建立一个分类模型。经过训...
- 陈超逸
- 关键词:多标记学习互信息
- 基于自步学习和主成分分析的代价敏感属性选择算法研究
- 当下社会中,随着对网络技术的深入研究和探索,基于互联网的应用也得到了飞速的发展和进步。物联网技术,人工智能等技术的广泛应用给人类生产生活带来便利的同时,也产生了海量的信息和高维数据。对高维数据的处理和使用不仅增加了计算机...
- 马超群
- 关键词:主成分分析
- 基于核稀疏表示的属性选择算法
- 2020年
- 为解决高维数据在分类时造成的“维数灾难”问题,提出一种新的将核函数与稀疏学习相结合的属性选择算法。具体地,首先将每一维属性利用核函数映射到核空间,在此高维核空间上执行线性属性选择,从而实现低维空间上的非线性属性选择;其次,对映射到核空间上的属性进行稀疏重构,得到原始数据集的一种稀疏表达方式;接着利用L 1范数构建属性评分选择机制,选出最优属性子集;最后,将属性选择后的数据用于分类实验。在公开数据集上的实验结果表明,该算法能够较好地实现属性选择,与对比算法相比分类准确率提高了约3%。
- 吕治政李扬定雷聪
- 关键词:非线性核函数
- 基于核函数与非平衡权重学习的属性选择算法
- 在现代计算机中,随着大数据和社会高速的发展,原始数据的维度往往会非常巨大。对于这样的高维数据,存储、应用以及传输的代价都极为昂贵;而最为关键的是,真正有效的属性所占比重并不高。为了能够有效的使用高维数据,释放存储空间,减...
- 张善文
- 关键词:核函数
- 基于局部结构学习的非线性属性选择算法
- 2020年
- 针对大多数高维数据之间不仅有相似性,而且还有非线性关系等特点,提出一种基于局部结构学习的非线性属性选择算法。该算法首先通过核函数把数据映射到高维空间,在高维空间中表示出数据属性之间的非线性关系;然后在低维空间中通过局部结构学习来充分挖掘属性之间的相似性,同时通过低秩约束来排除噪声的干扰;最后通过稀疏正则化因子来进行属性选择。其通过核函数映射来找出数据属性之间的非线性关系,运用局部结构学习来找出数据属性之间的相似性,是一种嵌入了局部结构学习的非线性属性选择算法。实验结果表明,该算法相比其他对比算法有更好的效果。
- 李佳烨张乐园雷聪甘江璋吕治政
- 关键词:核函数
- 基于核稀疏和主成分分析的属性选择算法研究
- 随着大数据和人工智能技术的蓬勃发展,社会各行业领域中都积累了大量的高维属性数据,高维属性数据中都会存在大量相关的冗余属性,高维属性数据不仅会增加存储空间的负担,而且占用了大量计算资源开销,更严重的是:高维属性数据会大大增...
- 吕治政
- 关键词:核函数主成分分析
- 基于核函数的稀疏属性选择算法被引量:2
- 2019年
- 鉴于传统属性选择算法无法捕捉属性之间的关系的问题,文中提出了一种非线性属性选择方法。该方法通过引入核函数,将原始数据集投影到高维的核空间,因在核空间内进行运算,进而可以考虑到数据属性之间的关系。由于核函数自身的优越性,即使数据通过高斯核投影到无穷维的空间中,计算复杂度亦可以控制得较小。在正则化因子的限制上,使用两种范数进行双重约束,不仅提高了算法的准确率,而且使得算法实验结果的方差仅为0.74,远小于其他同类对比算法,且算法更加稳定。在8个常用的数据集上将所提算法与6个同类算法进行比较,并用SVM分类器来测试分类准确率,最终该算法得到最少1.84%,最高3.27%,平均2.75%的提升。
- 张善文文国秋张乐园李佳烨
- 关键词:核函数L1范数
- 属性选择算法研究
- 不管是科学研究还是工业领域,都已经与各式各样的数据密不可分。随着精度要求的提高,高维数据变得愈加普遍。然而,高维数据不仅带来存储成本和计算开销的大幅增加,其中存在的大量冗余会给机器学习模型带来干扰,并最终导致获取知识的不...
- 朱永华
- 关键词:数据降维子空间学习
相关作者
- 何威

- 作品数:10被引量:13H指数:3
- 供职机构:广西师范大学
- 研究主题:子空间学习 属性选择算法 属性约简 线性判别分析 超图
- 刘星毅

- 作品数:21被引量:76H指数:6
- 供职机构:钦州学院
- 研究主题:缺失数据 最近邻 属性选择算法 最近邻算法 欧式距离
- 雷聪

- 作品数:12被引量:15H指数:3
- 供职机构:广西师范大学
- 研究主题:子空间学习 超图 属性选择算法 核函数 标签
- 钟智

- 作品数:50被引量:216H指数:8
- 供职机构:广西师范学院
- 研究主题:数据挖掘 软件工程 聚类 子空间学习 海洋牧场
- 王广涛

- 作品数:2被引量:0H指数:0
- 供职机构:西安交通大学电子与信息工程学院计算机科学与技术系
- 研究主题:信息熵 条件熵 属性选择算法 分类器性能