首页 | 本学科首页   官方微博 | 高级检索  
     检索      

数据挖掘中高维定性数据的粗糙集聚类
引用本文:来升强,朱建平.数据挖掘中高维定性数据的粗糙集聚类[J].统计研究,2005,22(8):56-5.
作者姓名:来升强  朱建平
作者单位:厦门大学经济学院计统系 (来升强),厦门大学经济学院计统系(朱建平)
基金项目:2004年国家教育部新世纪优秀人才支持计(NCET040608),国家统计局科研计划项目(LXZ0409)资助。
摘    要:一、引言数据挖掘的重要任务之一就是发现大型数据中的积聚现象(clusteringphenomena),并加以定量化描述。由于其处理的数据对象的特点,从分析思路和方法设计上都要充分地考虑数据类型和数据规模,主要困难在于维数灾(curseof dimensionality)问题。若将观测数据作为高维空间中的点集,则维数越高,数据点将越趋向边界,任意两个观测间的距离也将趋于同一临界值。这就导致距离聚类方法的效力减弱。而针对定性数据聚类分析中的维数灾问题,在已有的研究成果中主要有两种思路:(1)构建新的相似度或相异度指标,减小运算量,例如可以采用信息熵1]、相…

关 键 词:数据挖掘  粗糙集  聚类分析  

Clustering of Rough Set of Qualitative Data of High Dimension in Data Mining
Lai Shengqiang,Zhu Jianping.Clustering of Rough Set of Qualitative Data of High Dimension in Data Mining[J].Statistical Research,2005,22(8):56-5.
Authors:Lai Shengqiang  Zhu Jianping
Abstract:
Keywords:
本文献已被 CNKI 万方数据 等数据库收录!
点击此处可从《统计研究》浏览原始摘要信息
点击此处可从《统计研究》下载免费的PDF全文
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号