首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 31 毫秒
1.
针对传统模糊C-均值聚类方法(fuzzy C-means,简称FCM)对初始值敏感导致的易陷入局部最优和噪声敏感问题,文章提出一种基于广度优先搜索的变异加权模糊C-均值聚类算法.该算法通过改进具有全局搜索能力的广度优先搜索算法(Breadth Fist Search,BFS)和有效聚类评价函数相结合,确定了接近真实的初始聚类中心,同时能够剔除噪声数据.在此基础上考虑属性噪声对聚类结果的影响问题,引入变异系数赋权法对FCM的目标函数进行改进,进一步提高了FCM算法的抗噪性.实验结果表明,该算法能够有效的克服传统FCM的不足,与其他聚类算法相比,具有较快的收敛速度、更好的聚类准确率及较高的抗噪性.  相似文献   

2.
文章回顾了经典的K-means算法,分析了其存在的两个突出缺点:无法自行确定聚类数k和对初始聚类中心点十分敏感.受光电效应实验中电子束在反向电场中的串行规律启发,提出了基于捕获流动中心试点的自适应确定聚类数目的K-means算法,该算法模拟电子束在异性电子云中的串行,令数据点簇捕获流动的聚类中心试点,来消除多余的初始聚类中心,从而达到解决K-means算法的存在的缺陷问题.实验表明,该算法具有很强的自行确定聚类数的能力,也大大降低了对初始聚类中心选择的敏感度.  相似文献   

3.
有序秩聚类及对地震活跃期的分析   总被引:1,自引:0,他引:1       下载免费PDF全文
 本文在对Fisher最优求解有序聚类方法和有序近邻聚类方法剖析的基础上,提出了有序秩聚类分析方法,并对Fisher最优求解、有序近邻聚类和有序秩聚类在计算效率上进行了比较分析,研究表明有序秩聚类在处理海量数据具有明显的优势。最后利用该方法对我国南北地震带活跃期进行分析,取得了良好的效果。  相似文献   

4.
聚类分析是常用的多元统计方法,但是对于多维有序样本的聚类较少见。在考虑多个指标的经济年代划分问题中,需要使用多维的聚类方法,而目前统计软件中大部分没有这种方法。文章提出了两种解决此类问题的统计方法。这些方法都是在原有的统计聚类方法的基础上得到的,在一般的统计软件上易于实现,分类的效果良好。  相似文献   

5.
对于一类变量非线性相关的面板数据,现有的基于线性算法的面板数据聚类方法并不能准确地度量样本间的相似性,且聚类结果的可解释性低。综合考虑变量非线性相关问题及聚类结果可解释性问题,提出一种非线性面板数据的聚类方法,通过非线性核主成分算法实现对样本相似性的测度,并基于混合高斯模型进行样本概率聚类,实证表明该方法的有效性及其对聚类结果的可解释性有所提高。  相似文献   

6.
针对实际能够获取到的样本银行数量少而无法准确划分信用级别的问题,文章构建了一个小样本评级模型:通过逼近理想点赋权模型确定评级指标的权重,建立评级总得分的测算模型;通过非参数核密度估计方法与切片取样方法获得反映小样本分布规律的评级大样本,解决了科学扩充小样本的难题;通过ward聚类对评级大样本进行有序分类,建立了可分为9个信用级别的小样本评级模型.  相似文献   

7.
目前研究的模糊C均值聚类算法(FCM)面临的最重要问题是初始值随机选取,导致其容易陷入局部最优,同时影响运算速度.而灰色预测GM(1,1)模型在形成预测公式时对初始值的选取也没有合理有效的方案.针对以上问题,文章提出坐标密度法,确定初始聚类中心,对FCM算法进行改进;接着提出运用改进的FCM求取GM(1,1)中数据的聚类中心,并把聚类中心作为初始值的方法;通过与已知算法进行比较验证了其可行性和有效性.  相似文献   

8.
基于遗传算法的投影寻踪聚类   总被引:1,自引:0,他引:1  
传统的投影寻踪聚类算法PROCLUS是一种有效的处理高维数据聚类的算法,但此算法是利用爬山法(Hill climbing)对各类中心点进行循环迭代、选取最优的过程,由于爬山法是一种局部搜索(local search)方法,得到的最优解可能仅仅是局部最优。针对上述缺陷,提出一种改进的投影寻踪聚类算法,即利用遗传算法(Genetic Algorithm)对各类中心点进行循环迭代,寻找到全局最优解。仿真实验结果证明了新算法的可行性和有效性。  相似文献   

9.
基于统计与聚类的信用评级新方法   总被引:1,自引:0,他引:1  
文章针对国内信用评级研究面临的违约率数据缺失的问题,提出了一种综合回归思想与聚类算法的方法.通过得到的模拟数据进行回归分析,得到了关于回归与聚类一致性和最优输入参数两个回归方程;以回归方程来指导聚类算法,并利用我国2012年226家上市公司的财务数据对方法的有效性进行了检验.  相似文献   

10.
支持向量机是在两分类的基础上发展起来的,如何将两分类成果推广到多分类中是支持向量机的一个重要问题.文章在聚类分类的基础上根据二叉树思想,提出了一种新的聚类算法来进行多分类.此方法充分利用二叉树中分两类的简便之处,将多类的聚类简化为点的聚类,从而避免了以往聚类方法中可能出现的同一类的点在聚类中变成不同类的问题,并结合选址问题中固定数目的配送点的选址算法,将原问题进行简化,对多分类问题提出了新的聚类算法.  相似文献   

11.
本文引入了有序样本聚类的方法,对我国网民数量的增长率进行分析,从而给出了网民发展阶段划分的数据支持,进而对我国网民增速放缓的原因做出一些分析.  相似文献   

12.
针对基于众包竞赛中欺诈者筛除机制的黄金标准数据方法、聚类算法的离群点检测算法K-means-算法和DBSCAN算法,依赖于事先给定的参数,不适合大规模数据集检测的问题,提出基于样本连通图的离群点检测算法。首先,给定参数并重复调用离群点检测算法,识别数据中的离群点和聚类;其次,计算每两个样本之间的连接次数和连接强度,在给定连接强度下界δ的情况下,根据样本的连接强度来构造样本之间的连通图;最后,根据样本之间的连通情况,对样本进行标记,把样本标记为聚类节点和离群点。实验结果表明,该算法在放宽参数设置范围的情况下,缩小了离群点个数波动范围,提升了离群点识别准确率,优于对比算法和经典的黄金标准数据方法。  相似文献   

13.
文章介绍了基于高斯混合模型的期望最大化聚类算法,并对模型进行了简化,运用案例分析了该模型在经济管理领域中的应用,利用可视化的图形展示了研究样本的概率密度.  相似文献   

14.
在研究经济问题时,经常遇到分类的问题,多元统计分析中的聚类分析方法可以解决多指标分类问题。本文介绍一种按着系统聚类步骤产生的有序样本聚类法,并利用这种方法对我国改革开放26年来的产业结构变迁进行聚类,揭示结构变迁与经济增长的关系,从而说明有序样本聚类法在经济分类研究中的作用。  相似文献   

15.
传统的K-Prototypes聚类算法是利用划分的思想来对混合数据进行聚类,但是当混合数据的维度增大时,对象之间的差异度几乎相等,使得此算法难以进行。针对上述缺陷,文章提出一种改进的K-Prototyes聚类算法,聚类前先剔除各类中不相关的维度,将高维混合数据投影降维后再进行聚类。文中给出了Heart Disease Databases的算例,验证了算法的有效性。  相似文献   

16.
多指标面板数据能够较全面的提供研究对象的信息和数据特征,但复杂的数据结构也给其聚类分析带来了一定的困难.针对这一问题,文章提出了基于特征提取的多指标面板数据聚类方法,该方法将能够表征面板数据动态变化的“绝对量”特征、“波动”特征、“偏度”特征、“峰度”特征及“趋势”特征引入动态聚类算法中,可以避免以往采用欧式距离进行聚类的局限性,还可以处理带有缺失数据的面板数据,同时大大提高了聚类效率,并最大限度地保证时间维度信息不受损失.利用该方法分析了2001至2013年我国不同省份道路交通事故的不平衡状况,通过实证分析表明该方法能够解决多指标面板数据聚类的问题.  相似文献   

17.
农业险定价中的核心问题是农业风险区划问题,为了体现农业区划中个体指标的动态发展特征,根据近邻传播改进自适应近邻传播聚类方法对数据进行优化,基于轮廓系数、归属度和吸引度得到最佳聚类中心和几何聚类中心,并将聚类转化为新数据集的聚类问题;选取代表性的棉花为例进行实证分析,通过计算生产、销售、收入、财政等指标进行棉花风险区划实例分析,计算最优棉花风险区划,结果表明对于具有动态特征的数据,本模型具有很好的有效性、实用性和解释性。  相似文献   

18.
文章提出了一种基于聚类组合和支持向量机的短期负荷预测方法.该方法首先使用SOM网络训练规格化的特征数据并获得初始聚类中心;然后将初始聚类中心作为C-均值算法的输入,使用DB指数评价聚类结果以获得最佳聚类数,通过训练可得到相似日样本;最后选择合适的参数和核函数构造支持向量机模型来进行逐点负荷预测.  相似文献   

19.
研究了一种附有引力影响因子的半监督K-means核函数聚类算法,并将该方法应用于多因子选股模型中。研究表明,相比传统的聚类模型,改进的模型具有较强的泛化能力,模型在处理样本线性不可分、样本分布非球状簇等问题上具有明显的优势,能选出较优的股票组合。  相似文献   

20.
聚类在数据挖掘、模式识别等许多领域有着重要的应用.本文介绍了聚类算法的几种分类,并例举了几种基于密度的聚类算法.最后以一种新颖的基于最大不相含核心点集的聚类算法LSNCCP为例,详细介绍整个聚类算法的工作过程.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号