首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 15 毫秒
1.
本文介绍一种按着系统聚类步骤产生的有序样本聚类法,并利用这种方法对我国改革开放26年来的产业结构变迁进行聚类,从而揭示结构变迁与经济增长的关系。有序样本系统聚类法,首先根据所观察到的多变量有序样本,计算两两相邻样本之间的距离,得初始距离矩阵:D=d12…0┇d23┇0…d(n-1)n其中dii 1表示第i个样本与第i 1个样本之间的距离。将距离最近的两个相邻样本聚为一类,然后再计算合并的新类到其相邻的类(或样本)的距离,得第一次并类后的距离矩阵D1。从D1中找距离最近的两类合并成一个新类。而后计算新类到相邻两类的距离,得第二次并类后的…  相似文献   

2.
聚类分析是常用的多元统计方法,但是对于多维有序样本的聚类较少见。在考虑多个指标的经济年代划分问题中,需要使用多维的聚类方法,而目前统计软件中大部分没有这种方法。文章提出了两种解决此类问题的统计方法。这些方法都是在原有的统计聚类方法的基础上得到的,在一般的统计软件上易于实现,分类的效果良好。  相似文献   

3.
林盛  白寅 《统计与决策》2006,(14):16-18
1系统聚类方法及其存在的问题1.1系统聚类法为了将样本进行分类,就需要研究样本之间关系。目前用得最多的方法有两个:一种方法是用相似系数,比较相似的样本归为一类,不相似的样本归为不同的类。另一种方法是将一个样本看作P维空间的一个点,并在空间定义距离,距离较近的点归为一  相似文献   

4.
改进的投影寻踪分类模型及其在区域经济评价中的应用   总被引:1,自引:0,他引:1  
姚奕  倪勤 《统计与信息论坛》2009,24(2):29-32,50
作为多元数据的一种分析方法,投影寻踪分类模型已被一些研究者应用到实践中,并取得了良好的效果.然而,投影寻踪分类模型没有严格意义上的分类标准.通过引入有序样本聚类法,可以对投影寻踪分类模型得到的一维投影值进行客观分类.根据改进的模型,对江苏省区域经济的发展进行了综合评价,结果表明:改进的投影寻踪分类模型切实可行,为多元数据分类提供了新途径.  相似文献   

5.
传统的解决有序样本聚类的Fisher最优分割法对计算机存储能力要求较高,不适合由于样本长度较大时的情况.实践中常用的最优二分割法只能求得局部最优解.文章提出了一种基于遗传算法解决有序样拳聚类问题的新算法.该算法适用于多种聚类距离,适合于大样本,可以解决方向聚类问题.  相似文献   

6.
针对灰色聚类指标权重确定的问题,通过定义白化权函数的分类区分度来度量各指标对聚类对象的分类所作的贡献,并据此确定分类指标的权重。在此基础上,提出了变权灰色聚类方法。结果表明,该方法能够融合聚类对象的样本信息和专家的经验,有效确定不同聚类对象的各指标权重,且适用于聚类指标的量纲不同、数量级悬殊较大的情形。最后通过一个实例说明了变权灰色聚类的实用性和有效性。  相似文献   

7.
针对实际能够获取到的样本银行数量少而无法准确划分信用级别的问题,文章构建了一个小样本评级模型:通过逼近理想点赋权模型确定评级指标的权重,建立评级总得分的测算模型;通过非参数核密度估计方法与切片取样方法获得反映小样本分布规律的评级大样本,解决了科学扩充小样本的难题;通过ward聚类对评级大样本进行有序分类,建立了可分为9个信用级别的小样本评级模型.  相似文献   

8.
一 聚类分析是对多指标(变量)研究对象进行分类的一种多元统计分析方法.聚类分析依据定义的研究对象之间的相近程度(距离或相似系数),将性质相近的对象聚为一类,性质不相近的对象不能聚为一类.在一般的系统聚类和动态聚类中,研究对象(样本)之间是不考虑顺序的,只要两个样本之间的距离最近,就将其聚为一类.但是,在实际问题中,我们观察到的样本,特别是按时间顺序观察到的样本,是不能随便打乱顺序,将任意两个距离最近的样本聚为一类的.例如,观察儿童的生长发育过程,按着每年增加的体重,将生长期进行阶段分类,就不可以将新生儿期与学龄期分在一类,因为这中间还有一个幼儿期.  相似文献   

9.
有序秩聚类及对地震活跃期的分析   总被引:1,自引:0,他引:1       下载免费PDF全文
 本文在对Fisher最优求解有序聚类方法和有序近邻聚类方法剖析的基础上,提出了有序秩聚类分析方法,并对Fisher最优求解、有序近邻聚类和有序秩聚类在计算效率上进行了比较分析,研究表明有序秩聚类在处理海量数据具有明显的优势。最后利用该方法对我国南北地震带活跃期进行分析,取得了良好的效果。  相似文献   

10.
以内蒙古自治区12个盟市的绿色资源环境发展为研究对象,采用灰色动态聚类与粗糙集相结合的方法,构建包含有全年供水量等11个指标的内蒙古自治区绿色资源环境指标体系,其要点在于:一是通过灰色关联分析建立样本间的灰色关联矩阵,进而进行样本间的灰色聚类,反映样本间的信息重复性;二是采用动态聚类方法,每次去除一个指标后继续通过灰色关联分析建立的灰色关联矩阵进行灰色样本聚类,为粗糙集约简提供信息数据;三是通过粗糙集约简理论判断海选指标对聚类结果的影响是否显著,将每一次的聚类结果与原始聚类结果比较,保留两次聚类结果不同且对评价样本分类有显著影响的海选指标;四是采用非参数Kruska-Wallis检验的P值检验法证明本文构建的指标体系是合理的。通过对比分析表明,本文的灰色动态聚类-粗糙集指标筛选模型优于现有研究的聚类-灰色关联指标筛选模型。  相似文献   

11.
基于聚类分析的基本思想测算差别费率,选择层次聚类法中的Q聚类方法,以伤亡率和应支率作为聚类指标,对各个行业进行分类。根据总体平衡的基金筹集原则,建立了差别费率测算模型,以西安市的调查数据为基础,对模型进行了检验和应用性研究。  相似文献   

12.
针对不平衡数据集中的少数类样本在实际应用中分类准确率较低的问题,提出一种利用多数类样本的自然最近邻进行欠采样的数据处理方法。自然最近邻算法根据每个样本的分布特征动态地为样本选择数量不同的自然最近邻样本,通过自然最近邻的个数反映样本分布的疏密程度。文章所提方法先计算多数类样本在整体数据集中的自然最近邻,根据自然最近邻情况移除多数类中的噪声样本和局部密度较小的样本,再计算剩余样本的相似度,保留密集区域中的代表性样本,去掉部分冗余样本,获得平衡数据集。该方法的计算无须预先指定参数,减少了欠采样过程中多数类分类信息的损失。对比实验利用支持向量机对不同欠采样方法平衡后的12个数据集进行分类,结果表明此方法在大多数数据集上具有较优的分类性能,提升了少数类样本的分类准确率。  相似文献   

13.
华锐  梁娜 《统计与决策》2012,(23):69-71
对样本分类的方法很多,比如广义朴素贝叶斯分类器[1],层次-聚类模型[2],神经网络[3]等,但对小样本的分类却存在很多困难,如:小样本的代表性不够,不能覆盖所有属性,分类器分类效果不佳等问题,文章提出的结合拉普拉斯校准的特征加权朴素贝叶斯分类器操作简单,能高效地解决了以上问题。  相似文献   

14.
目前对经济区域进行分类通常采用主成分分析法等方法进行研究。文章在研究经济区域资源位的过程中引入了聚类算法,并将支撑向量机算法(SVM)引入该研究领域。结合算法原理说明了将其引入经济区域分类的可行性;同时对应用两种算法对经济区域进行分类的结果作出了比较,对应用聚类和支撑向量机两种算法对经济区域进行分类的优缺点进行了分析。  相似文献   

15.
支持向量机是在两分类的基础上发展起来的,如何将两分类成果推广到多分类中是支持向量机的一个重要问题.文章在聚类分类的基础上根据二叉树思想,提出了一种新的聚类算法来进行多分类.此方法充分利用二叉树中分两类的简便之处,将多类的聚类简化为点的聚类,从而避免了以往聚类方法中可能出现的同一类的点在聚类中变成不同类的问题,并结合选址问题中固定数目的配送点的选址算法,将原问题进行简化,对多分类问题提出了新的聚类算法.  相似文献   

16.
现有聚类方法都是基于消费者全部的行为信息,对于观测不完全的信息,提出了三阶段聚类方法。首先,使用样本数据的全部信息对消费者聚类;接着仅使用人口统计变量建立分类模型;最后对上述结果进行修正。三阶段聚类方法最大优点是可以将没有入选样本的个体分配到由样本个体得到的行为集群中去,将这个方法应用于电视行业,得到了很有实际应有价值的结果。  相似文献   

17.
对于一类变量非线性相关的面板数据,现有的基于线性算法的面板数据聚类方法并不能准确地度量样本间的相似性,且聚类结果的可解释性低。综合考虑变量非线性相关问题及聚类结果可解释性问题,提出一种非线性面板数据的聚类方法,通过非线性核主成分算法实现对样本相似性的测度,并基于混合高斯模型进行样本概率聚类,实证表明该方法的有效性及其对聚类结果的可解释性有所提高。  相似文献   

18.
本文利用模糊聚类分析和多元统计分析,给出了求最优模糊聚类的方法和对基于重金属和有机氯的土壤环境质量进行聚类和分级的方法,并利用该聚类和分级的方法对太湖地区某市农田的土壤样进行聚类和分级。从聚类结果来看,本方法分类是将环境质量相近的土壤样分在同一类。从分类结果来看,绝大部分土壤样处于相对安全状态,适于一般农业经济产品的产生。本文所用方法有利于土壤环境质量研究的定量和数字化。  相似文献   

19.
一种加权主成分距离的聚类分析方法   总被引:1,自引:0,他引:1  
吕岩威  李平 《统计研究》2016,33(11):102-108
指标之间的高度相关性及其重要性差异导致了传统聚类分析方法往往无法获得良好的分类效果。本文在对传统聚类分析方法及其各种改进方法局限性展开探讨的基础上,运用数学方法重构了分类定义中的距离概念,通过定义自适应赋权的主成分距离为分类统计量,提出一种新的改进的主成分聚类分析方法——加权主成分距离聚类分析法。理论研究表明,加权主成分距离聚类分析法系统集成了已有聚类分析方法的优点,有充分的理论基础保证其科学合理性。仿真实验结果显示,加权主成分距离聚类分析法能够有效解决已有聚类分析方法在特定情形下的失真问题,所得分类效果更为理想。  相似文献   

20.
一、引言   聚类分析是研究事物分类的一种方法.这种方法的特点是只根据事物本身的特征分类,即将事物性质相近的归为一类,性质差异较大的归在不同的类.而图论聚类法又是聚类分析中常用的一种分析方法,最早是由Zahn提出来的,又称为最小支撑数聚类法.……  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号