首页 | 本学科首页   官方微博 | 高级检索  
     检索      

基于稀疏聚类的高维数据特征选择及应用
引用本文:张陶陶,胡亚南,李扬,田茂再.基于稀疏聚类的高维数据特征选择及应用[J].统计与决策,2017(4):18-24.
作者姓名:张陶陶  胡亚南  李扬  田茂再
作者单位:1. 中国人民大学应用统计科学研究中心,北京100872;中国人民大学统计学院,北京100872;2. 中国人民大学应用统计科学研究中心,北京100872;中国人民大学统计学院,北京100872;新疆财经大学新疆社会经济统计研究中心,乌鲁木齐830012;新疆财经大学统计与信息学院,乌鲁木齐830012;兰州财经大学统计学院,兰州730101
基金项目:中国人民大学科学研究基金(中央高校基本科研业务费专项资金资助)项目(15XNL008)
摘    要:文章研究了一种高维数据聚类特征选择方法——稀疏聚类,稀疏聚类是通过对特征变量赋予权重,并添加lasso惩罚因子,压缩权重,得到对变量的权重排序,即重要性排序,使其在进行分类预测的同时达到自动剔除冗余变量的效果,从而起到了对高维数据聚类时的特征选择作用.将此方法运用于中国环保问题,将中国31个省份根据环保情况分为3类,并从现有的104个环保指标中筛选得到20个重要指标.

关 键 词:稀疏聚类  高维数据  聚类  特征选择

High-Dimension Data Feature Selection and the Application Based on Sparse Clustering
Authors:Zhang Taotao  Hu Yanan  Li Yang  Tian Maozai
Abstract:
Keywords:
本文献已被 万方数据 等数据库收录!
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号