首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 93 毫秒
1.
一 聚类分析是对多指标(变量)研究对象进行分类的一种多元统计分析方法.聚类分析依据定义的研究对象之间的相近程度(距离或相似系数),将性质相近的对象聚为一类,性质不相近的对象不能聚为一类.在一般的系统聚类和动态聚类中,研究对象(样本)之间是不考虑顺序的,只要两个样本之间的距离最近,就将其聚为一类.但是,在实际问题中,我们观察到的样本,特别是按时间顺序观察到的样本,是不能随便打乱顺序,将任意两个距离最近的样本聚为一类的.例如,观察儿童的生长发育过程,按着每年增加的体重,将生长期进行阶段分类,就不可以将新生儿期与学龄期分在一类,因为这中间还有一个幼儿期.  相似文献   

2.
本文介绍一种按着系统聚类步骤产生的有序样本聚类法,并利用这种方法对我国改革开放26年来的产业结构变迁进行聚类,从而揭示结构变迁与经济增长的关系。有序样本系统聚类法,首先根据所观察到的多变量有序样本,计算两两相邻样本之间的距离,得初始距离矩阵:D=d12…0┇d23┇0…d(n-1)n其中dii 1表示第i个样本与第i 1个样本之间的距离。将距离最近的两个相邻样本聚为一类,然后再计算合并的新类到其相邻的类(或样本)的距离,得第一次并类后的距离矩阵D1。从D1中找距离最近的两类合并成一个新类。而后计算新类到相邻两类的距离,得第二次并类后的…  相似文献   

3.
基于形状特征的多指标面板数据聚类方法及其应用   总被引:1,自引:0,他引:1  
针对多指标面板数据的样品分类问题,从特征提取角度提出一个多指标面板数据的聚类分析方法。该方法将时间序列的局部变化特性与整体距离关系结合起来,将局部变化的信息融入相似测度的计算中,提出一种自适应滑动窗口分段方法,实现时间序列局部变化的特征提取,在重新定义综合距离的基础上,提出一种聚类方法。通过实证分析,表明新方法能够解决多指标面板数据聚类的问题,分类效果较好。  相似文献   

4.
孙旭 《统计教育》2009,(3):55-59
本文指出了用点和点距离度量时间序列相似性存在的问题,并给出一种新的相似性度量一全局特征,即从时间序列的统计分布特征、非线性和傅立叶频谱转换等3个方面提取全局特征构建特征向量,并进行聚类分析。本文以全国各地区人均GDP时间序列聚类为例,评估了距离相似法与全局特征法的聚类结果。实践证实全局特征法不但可以处理不同长度有缺失值的时序聚类,而且可以降低大型时间序列数据聚类计算的复杂度。  相似文献   

5.
李军  段进东 《统计与决策》2006,(10):127-128
0引言模糊聚类中的最大树法是直接对模糊相似关系矩阵进行分析,该方法尤其适用于待分类样本数量多的情况。目前相关文献大致有欧氏距离、切比雪夫距离、相关系数等十三种确定模糊相似关系矩阵元素的方法,但最常用的方法是绝对值减数法:γij=1i=j1-cmk=1∑|χik-χjk|i≠(1)其  相似文献   

6.
文章提出了一种基于互信息量的改进K-Modes聚类方法,采用样本互信息来刻画数据对象属性之间的相互关系。在此基础上提出了一种新的距离度量,该距离度量方法既考虑了对象某个属性值本身的不同,又考虑了对象其它属性对该属性值的影响,使之更符合实际问题情况。实验结果表明,聚类方法有效地提高了聚类精度。  相似文献   

7.
文章提出了一种基于聚类组合和支持向量机的短期负荷预测方法.该方法首先使用SOM网络训练规格化的特征数据并获得初始聚类中心;然后将初始聚类中心作为C-均值算法的输入,使用DB指数评价聚类结果以获得最佳聚类数,通过训练可得到相似日样本;最后选择合适的参数和核函数构造支持向量机模型来进行逐点负荷预测.  相似文献   

8.
距离判别理论中,通常采用重心距离来定义类与类之间的距离对待判样品进行判别。对新样品实行判别,将其归入系统聚类形成的分类,如果仍采用重心距离判别法,会由于没有与原有聚类时所用的类与类之间的距离相一致而产生误判。提出对基于系统聚类分类结果的距离判别理论方法的补充,把系统聚类中的八种类与类之间距离的概念引入到距离判别方法中。从而使距离判别中类与类距离的定义与系统聚类中相一致,通过实例分析,证明增强了距离判别的可靠性。  相似文献   

9.
支持向量机是在两分类的基础上发展起来的,如何将两分类成果推广到多分类中是支持向量机的一个重要问题.文章在聚类分类的基础上根据二叉树思想,提出了一种新的聚类算法来进行多分类.此方法充分利用二叉树中分两类的简便之处,将多类的聚类简化为点的聚类,从而避免了以往聚类方法中可能出现的同一类的点在聚类中变成不同类的问题,并结合选址问题中固定数目的配送点的选址算法,将原问题进行简化,对多分类问题提出了新的聚类算法.  相似文献   

10.
为解决马田系统多分类算法存在的样本重复训练以及分类准确率下降等问题,文章提出了一种基于改进的类间相似方向数(Number of Inter-class Similarity Direction,NISD)的偏二叉树马田系统多分类算法。该算法利用马氏距离改进类间相似方向数,获得更为科学的样本分类顺序,依此顺序自上而下生成整个偏二叉树,在非叶子节点构造马田系统二分类器,生成最终的分类模型。对于含k个类别的待分类样本,该算法只用训练k-1个二分类器,便可得到马田系统多分类模型,与此同时,层层剥离样本减少了样本的重复训练。UCI数据集实验结果表明,该算法分类效率更高,分类准确率也较高。  相似文献   

11.
以内蒙古自治区12个盟市的绿色资源环境发展为研究对象,采用灰色动态聚类与粗糙集相结合的方法,构建包含有全年供水量等11个指标的内蒙古自治区绿色资源环境指标体系,其要点在于:一是通过灰色关联分析建立样本间的灰色关联矩阵,进而进行样本间的灰色聚类,反映样本间的信息重复性;二是采用动态聚类方法,每次去除一个指标后继续通过灰色关联分析建立的灰色关联矩阵进行灰色样本聚类,为粗糙集约简提供信息数据;三是通过粗糙集约简理论判断海选指标对聚类结果的影响是否显著,将每一次的聚类结果与原始聚类结果比较,保留两次聚类结果不同且对评价样本分类有显著影响的海选指标;四是采用非参数Kruska-Wallis检验的P值检验法证明本文构建的指标体系是合理的。通过对比分析表明,本文的灰色动态聚类-粗糙集指标筛选模型优于现有研究的聚类-灰色关联指标筛选模型。  相似文献   

12.
传统的解决有序样本聚类的Fisher最优分割法对计算机存储能力要求较高,不适合由于样本长度较大时的情况.实践中常用的最优二分割法只能求得局部最优解.文章提出了一种基于遗传算法解决有序样拳聚类问题的新算法.该算法适用于多种聚类距离,适合于大样本,可以解决方向聚类问题.  相似文献   

13.
在研究经济问题时,经常遇到分类的问题,多元统计分析中的聚类分析方法可以解决多指标分类问题。本文介绍一种按着系统聚类步骤产生的有序样本聚类法,并利用这种方法对我国改革开放26年来的产业结构变迁进行聚类,揭示结构变迁与经济增长的关系,从而说明有序样本聚类法在经济分类研究中的作用。  相似文献   

14.
文章在一个一般性的框架下研究了利用基函数展开进行函数型数据聚类的问题.在这个框架之下,大量传统的聚类方法都可以直接应用到函数型数据分析.另外,我们将Pearson相似系数引入函数型数据聚类分析,解决了欧式距离无法刻画曲线之间形态差异的问题.  相似文献   

15.
在面板数据聚类分析方法的研究中,基于面板数据兼具截面维度和时间维度的特征,对欧氏距离函数进行了改进,在聚类过程中考虑指标权重与时间权重,提出了适用于面板数据聚类分析的"加权距离函数"以及相应的Ward.D聚类方法。首先定义了考虑指标绝对值、邻近时点增长率以及波动变异程度的欧氏距离函数;然后,将指标权重与时间权重通过线性模型集结成综合加权距离,最终实现面板数据的加权聚类过程。实证分析结果显示,考虑指标权重与时间权重的面板数据加权聚类分析方法具有更好的分辨能力,能提高样本聚类的准确性。  相似文献   

16.
针对基于众包竞赛中欺诈者筛除机制的黄金标准数据方法、聚类算法的离群点检测算法K-means-算法和DBSCAN算法,依赖于事先给定的参数,不适合大规模数据集检测的问题,提出基于样本连通图的离群点检测算法。首先,给定参数并重复调用离群点检测算法,识别数据中的离群点和聚类;其次,计算每两个样本之间的连接次数和连接强度,在给定连接强度下界δ的情况下,根据样本的连接强度来构造样本之间的连通图;最后,根据样本之间的连通情况,对样本进行标记,把样本标记为聚类节点和离群点。实验结果表明,该算法在放宽参数设置范围的情况下,缩小了离群点个数波动范围,提升了离群点识别准确率,优于对比算法和经典的黄金标准数据方法。  相似文献   

17.
文章将相对隶属度引入到灰色聚类评估中,对灰色最优聚类评估问题进行了研究。通过样本观测值与标准特征值的关联系数来反映评估对象与各类中心的相似程度,在此基础上,基于相对隶属度的概念,建立了一种优化的灰色聚类评估模型,构造拉格朗日函数解得相对隶属度,最后根据相对隶属度的大小对评估对象进行归类,从而将分类模糊隶属度信息有效融入灰色聚类评估过程中。最后通过实例验证了该模型的有效性与实用性。  相似文献   

18.
基于聚类分析的订单分批拣货模型及启发式算法   总被引:2,自引:0,他引:2  
文章构造了拣货作业中订单分批问题的数学模型,在聚类分析的基础上,提出了三种相似系数计算公式,并建立了订单分批问题的聚类模型。然后采用启发式算法求解聚类模型得到分批结果,再根据分批模型求最短行走距离。最后以拣货行走的总距离为目标,用算例将算法与现有的分批方法进行比较,验证了模型和算法的有效性。  相似文献   

19.
对于一类变量非线性相关的面板数据,现有的基于线性算法的面板数据聚类方法并不能准确地度量样本间的相似性,且聚类结果的可解释性低。综合考虑变量非线性相关问题及聚类结果可解释性问题,提出一种非线性面板数据的聚类方法,通过非线性核主成分算法实现对样本相似性的测度,并基于混合高斯模型进行样本概率聚类,实证表明该方法的有效性及其对聚类结果的可解释性有所提高。  相似文献   

20.
聚类分析及其可视化方法   总被引:2,自引:0,他引:2  
一、聚类分析原理介绍 (一)什么是聚类 聚类就是将数据分组成为多个类.同一个类内部的对象具有较高的相似度,不同类之间的对象差别较大.聚类的目的是挖掘数据潜在的自然分组结构和关系.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号