首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 436 毫秒
1.
一 聚类分析是对多指标(变量)研究对象进行分类的一种多元统计分析方法.聚类分析依据定义的研究对象之间的相近程度(距离或相似系数),将性质相近的对象聚为一类,性质不相近的对象不能聚为一类.在一般的系统聚类和动态聚类中,研究对象(样本)之间是不考虑顺序的,只要两个样本之间的距离最近,就将其聚为一类.但是,在实际问题中,我们观察到的样本,特别是按时间顺序观察到的样本,是不能随便打乱顺序,将任意两个距离最近的样本聚为一类的.例如,观察儿童的生长发育过程,按着每年增加的体重,将生长期进行阶段分类,就不可以将新生儿期与学龄期分在一类,因为这中间还有一个幼儿期.  相似文献   

2.
一、基于统计聚类进行预警的基本思想聚类分析是一种对多元变量进行分类的方法,其原理是基于数据计算样品之间的距离或者夹角,在一定的阀值下  相似文献   

3.
距离判别理论中,通常采用重心距离来定义类与类之间的距离对待判样品进行判别。对新样品实行判别,将其归入系统聚类形成的分类,如果仍采用重心距离判别法,会由于没有与原有聚类时所用的类与类之间的距离相一致而产生误判。提出对基于系统聚类分类结果的距离判别理论方法的补充,把系统聚类中的八种类与类之间距离的概念引入到距离判别方法中。从而使距离判别中类与类距离的定义与系统聚类中相一致,通过实例分析,证明增强了距离判别的可靠性。  相似文献   

4.
一种加权主成分距离的聚类分析方法   总被引:1,自引:0,他引:1  
吕岩威  李平 《统计研究》2016,33(11):102-108
指标之间的高度相关性及其重要性差异导致了传统聚类分析方法往往无法获得良好的分类效果。本文在对传统聚类分析方法及其各种改进方法局限性展开探讨的基础上,运用数学方法重构了分类定义中的距离概念,通过定义自适应赋权的主成分距离为分类统计量,提出一种新的改进的主成分聚类分析方法——加权主成分距离聚类分析法。理论研究表明,加权主成分距离聚类分析法系统集成了已有聚类分析方法的优点,有充分的理论基础保证其科学合理性。仿真实验结果显示,加权主成分距离聚类分析法能够有效解决已有聚类分析方法在特定情形下的失真问题,所得分类效果更为理想。  相似文献   

5.
基于形状特征的多指标面板数据聚类方法及其应用   总被引:1,自引:0,他引:1  
针对多指标面板数据的样品分类问题,从特征提取角度提出一个多指标面板数据的聚类分析方法。该方法将时间序列的局部变化特性与整体距离关系结合起来,将局部变化的信息融入相似测度的计算中,提出一种自适应滑动窗口分段方法,实现时间序列局部变化的特征提取,在重新定义综合距离的基础上,提出一种聚类方法。通过实证分析,表明新方法能够解决多指标面板数据聚类的问题,分类效果较好。  相似文献   

6.
对由多个指标组成的多元数据进行聚类分析时,数据维度的增加、各指标与总体聚类的相关性程度不一致以及各指标服从的分布不同会增加聚类的复杂性,影响聚类结果的准确性,因此需要通过合适的方法来对多元数据进行聚类分析。针对这一问题,提出改进的带粘性的层次Dirichlet过程(sticky Hierarchical Dirichlet Process)方法来实现对多元数据的降维聚类,以解决各指标服从不同分布的问题,并用粘性参数反映各指标与总体聚类之间的相关性。用MCMC方法来估计模型参数。通过对仿真模拟数据和IRIS数据集的聚类分析,证实了该方法的有效性,同时发现单个指标与总体聚类的相关性越大,则相应的粘性参数越大,从而反映该指标在总体聚类中的重要性程度越高;并且当各指标数据中有粘性较大的指标时,带粘性的层次Dirichlet过程方法明显优于其他聚类方法,能够显著提高分类的准确性。  相似文献   

7.
面板数据的聚类分析可以进行压缩的预处理也可以不进行压缩,文章提出可以根据样品中各个指标的时序数据的趋势特征来考虑是否应该进行压缩或如何进行压缩。然后考虑聚类的统计量的设置,再后给出系统聚类法的计算公式。  相似文献   

8.
在面板数据聚类分析方法的研究中,基于面板数据兼具截面维度和时间维度的特征,对欧氏距离函数进行了改进,在聚类过程中考虑指标权重与时间权重,提出了适用于面板数据聚类分析的"加权距离函数"以及相应的Ward.D聚类方法。首先定义了考虑指标绝对值、邻近时点增长率以及波动变异程度的欧氏距离函数;然后,将指标权重与时间权重通过线性模型集结成综合加权距离,最终实现面板数据的加权聚类过程。实证分析结果显示,考虑指标权重与时间权重的面板数据加权聚类分析方法具有更好的分辨能力,能提高样本聚类的准确性。  相似文献   

9.
聚类分析是三大多元统计分析方法之一,在许多领域都有广泛的应用,特别是在模式识别或无学习分类领域,发挥着不可替代的作用。除谱系聚类的ward方法外,聚类分析的关键依据是样品间距。样品间距完全脱胎于几何中的距离概念,但样品间距在几何距离三角可加性里所隐含的各变量量纲必须一致且必须正交的两个关键特性或许是有意或许是不经意地被模糊了。文章认为各变量量纲一致且正交应是聚类分析的强制要求,而主成分分析是正交化的最佳手段,应该成为聚类分析程序相关模块的缺省设置或唯一选项。  相似文献   

10.
聚类分析结果的有效性辨析   总被引:1,自引:1,他引:0  
聚类分析方法使用不当,会导致聚类结果与定性分析结果不符.文章从选择聚类法和聚类分析指标二个方面阐述如何使用该方法,才能得到更为有效的分类结果.  相似文献   

11.
欧氏距离条件下的聚类分析没有考虑指标间的相关性,基于模型的聚类方法存在多重共线性影响参数稳定性等问题,针对上述问题,文章在欧式距离条件下对变量间具有相关性的数据样本进行聚类分析时,先构建变量间相关性结构的回归相关模型,再通过差分分析对变量间的多重共线进行消除,然后做聚类分析.并以1996-2011年9个省份城市教育投入情况进行聚类分析,结果表明,给出的聚类方法是有效的.  相似文献   

12.
统计指标的分类是理解并运用统计指标的基础。在讲授指标分类过程中,学生容易在多种分类面前产生疑惑,对指标不能正确归类,原因是对指标分类之间的关系并不清楚,本文按照指标值确定的不同阶段,描绘出指标分类之间的关系图。从教学效果来看,学生更易对指标进行正确归类,并加深对指标的认识,利于后面内容的学习。  相似文献   

13.
一、引言   聚类分析是研究事物分类的一种方法.这种方法的特点是只根据事物本身的特征分类,即将事物性质相近的归为一类,性质差异较大的归在不同的类.而图论聚类法又是聚类分析中常用的一种分析方法,最早是由Zahn提出来的,又称为最小支撑数聚类法.……  相似文献   

14.
基于聚类分析的基本思想测算差别费率,选择层次聚类法中的Q聚类方法,以伤亡率和应支率作为聚类指标,对各个行业进行分类。根据总体平衡的基金筹集原则,建立了差别费率测算模型,以西安市的调查数据为基础,对模型进行了检验和应用性研究。  相似文献   

15.
在全球气候危机下,发展旅游景区低碳经济是世界经济运行的方向.文章首先分析并构建了低碳旅游景区评价指标,接着将多元统计分析中的主成分分析和模糊聚类分析相结合,利用主成分分析对评价指标进行降维处理,并通过对主成分进行模糊聚类将待评价低碳旅游景区进行分类,并按照类间第一主成分均值来对类进行排序,对同一类内景区按照第一主成分大小排序实现类内排序,从而实现对整个低碳旅游景区的排序.最后实例分析了该方法的可行性和科学性.  相似文献   

16.
聚类分析及其可视化方法   总被引:2,自引:0,他引:2  
一、聚类分析原理介绍 (一)什么是聚类 聚类就是将数据分组成为多个类.同一个类内部的对象具有较高的相似度,不同类之间的对象差别较大.聚类的目的是挖掘数据潜在的自然分组结构和关系.  相似文献   

17.
文章针对多指标面板数据的样品分类问题,从多元统计学理论角度提出一个多指标面板数据的聚类分析方法。该方法综合考虑面板数据的水平指标、增量指标和增量变化率指标的时间序列特征及其非同步时间序列问题,在重新构造了离差平方和函数基础上,提出了一种聚类方法。通过实证分析,表明新方法能够解决多指标面板数据聚类的问题,分类效果较好。  相似文献   

18.
林盛  白寅 《统计与决策》2006,(14):16-18
1系统聚类方法及其存在的问题1.1系统聚类法为了将样本进行分类,就需要研究样本之间关系。目前用得最多的方法有两个:一种方法是用相似系数,比较相似的样本归为一类,不相似的样本归为不同的类。另一种方法是将一个样本看作P维空间的一个点,并在空间定义距离,距离较近的点归为一  相似文献   

19.
文章针对主成分综合评价主要环节的一般性问题展开讨论,给出可行的解决方案并进行了理论分析。在总结现有关于主成分聚类分析重要文献的基础上,通过构建客观赋权的加权主成分距离为聚类统计量,有效地解决了现有聚类模型不能处理指标共线性和重要性差异悬殊的问题。对比本文拓展的聚类模型与同类模型的分类效率发现,加权主成分聚类分析蕴含的客观合理性是其优势所在的根本原因。  相似文献   

20.
一、回归与判别分析 所谓判别分析,就是要判别一个样品究竞属于哪一类比较合适.这样做的前提是对总体已有一个分类.为了对总体分类,一般应该有训练样本,它的分类和统计指标都是已知的,然后从训练样本计算出判别规则,再根据判别规则去判别那个样品究竟属于哪一类.判别分析主要方法有距离判别、Bayes判别、Fisher判别等.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号