共查询到20条相似文献,搜索用时 31 毫秒
1.
聚类有效性指标是评价一种聚类方法划分质量和确定最佳聚类数目的重要工具.文章提出了一种新的聚类有效性指标——T指标,该有效性指标利用最小生成树思想计算类内内聚度,在计算的过程中不再与聚类中心发生直接联系.经反复实验证明新的有效性指标对各种形状分布的划分均有良好的评价表现,且能正确确定各种重叠度数据集的聚类数目. 相似文献
2.
3.
传统的K-Prototypes聚类算法是利用划分的思想来对混合数据进行聚类,但是当混合数据的维度增大时,对象之间的差异度几乎相等,使得此算法难以进行。针对上述缺陷,文章提出一种改进的K-Prototyes聚类算法,聚类前先剔除各类中不相关的维度,将高维混合数据投影降维后再进行聚类。文中给出了Heart Disease Databases的算例,验证了算法的有效性。 相似文献
4.
5.
K-means算法是处理大样本数据的聚类分析的常用算法之一.该算法的不足之处是聚类的数目k必须事先给定.文章提出应用黄金分割法来度量有关该聚类的有效性,该方法能自动优化确定最佳的聚类个数,以此实现大样本数据的有效聚类:并采用实际数据说明了方法的合理性和有效性. 相似文献
6.
7.
8.
文章提出了一种基于聚类组合和支持向量机的短期负荷预测方法.该方法首先使用SOM网络训练规格化的特征数据并获得初始聚类中心;然后将初始聚类中心作为C-均值算法的输入,使用DB指数评价聚类结果以获得最佳聚类数,通过训练可得到相似日样本;最后选择合适的参数和核函数构造支持向量机模型来进行逐点负荷预测. 相似文献
9.
针对传统模糊C-均值聚类方法(fuzzy C-means,简称FCM)对初始值敏感导致的易陷入局部最优和噪声敏感问题,文章提出一种基于广度优先搜索的变异加权模糊C-均值聚类算法.该算法通过改进具有全局搜索能力的广度优先搜索算法(Breadth Fist Search,BFS)和有效聚类评价函数相结合,确定了接近真实的初始聚类中心,同时能够剔除噪声数据.在此基础上考虑属性噪声对聚类结果的影响问题,引入变异系数赋权法对FCM的目标函数进行改进,进一步提高了FCM算法的抗噪性.实验结果表明,该算法能够有效的克服传统FCM的不足,与其他聚类算法相比,具有较快的收敛速度、更好的聚类准确率及较高的抗噪性. 相似文献
10.
基于统计与聚类的信用评级新方法 总被引:1,自引:0,他引:1
文章针对国内信用评级研究面临的违约率数据缺失的问题,提出了一种综合回归思想与聚类算法的方法.通过得到的模拟数据进行回归分析,得到了关于回归与聚类一致性和最优输入参数两个回归方程;以回归方程来指导聚类算法,并利用我国2012年226家上市公司的财务数据对方法的有效性进行了检验. 相似文献
11.
灰色聚类法在课程评估中的应用 总被引:2,自引:0,他引:2
灰色聚类是以灰数的白化函数生成为基础的一种聚类方法。文章首先提出采用加权平均法则,对聚类结果可进行再分析,以充分利用信息,使评判结果更为合理。同时应用灰色聚类法对西安统计学院4门课程进行了综合评价分析,其结果符合实际。 相似文献
12.
13.
文章研究了存在两类故障的系统可靠度及非周期不完全预防维修模型.根据退化和随机冲击模型构建了系统的可靠度函数.为了满足可靠性要求,提出非周期不完全预防维修模型.以长期运行平均维修费用率最小为目标,给出不完全预防维修计划的确定方法,分析了模型参数对维修策略的影响. 相似文献
14.
Q型系统聚类分析中的统计检验问题 总被引:2,自引:1,他引:1
Q型系统聚类分析已经越来越成为人们广泛应用的多元统计分析方法。然而在应用中盲目套用系统聚类分析方法的情况很多,并对聚类分析方法的适用性、聚类过程的合理性、聚类结果的有效性等问题分析重视不够,更谈不上对聚类分析进行统计检验。因此,为了更好地应用Q型系统聚类分析,就应对Q型系统聚类分析结果进行统计检验并建立统计检验体系。Q型系统聚类分析统计检验体系主要包括:Q型系统聚类分析结果的有效性检验;聚类分析类(组)数选择合理性检验;聚类变量的显著性检验。 相似文献
15.
目前研究的模糊C均值聚类算法(FCM)面临的最重要问题是初始值随机选取,导致其容易陷入局部最优,同时影响运算速度.而灰色预测GM(1,1)模型在形成预测公式时对初始值的选取也没有合理有效的方案.针对以上问题,文章提出坐标密度法,确定初始聚类中心,对FCM算法进行改进;接着提出运用改进的FCM求取GM(1,1)中数据的聚类中心,并把聚类中心作为初始值的方法;通过与已知算法进行比较验证了其可行性和有效性. 相似文献
16.
随着大数据时代的来临,近年来函数型数据分析方法成为研究的热点问题,针对曲线的聚类分析方法引起了学界的关注.给出一种曲线聚类的方法:以L2距离作为亲疏程度的度量,在B样条基底函数展开表述下,将曲线本身信息、曲线变化信息引入聚类算法构建,并实现了曲线聚类与传统多元统计聚类方法的对接.作为应用,以城乡收入函数聚类实例验证了该曲线聚类方法,结果表明,在引入曲线变化信息的情况下,比仅考虑曲线本身信息能够取得更好的聚类效果. 相似文献
17.
文章研究了在大群体决策中,专家们在对方案进行比较时,给出的信息具有不同的表达形式,且含有残缺值的问题.首先把专家给出的不同表达形式的偏好信息统一转化为效用值,用专家给出的效用偏好值的平均值表示残缺值偏好信息.在此基础上,有相同偏好的专家聚为一类,确定专家权重,对所有专家给出的偏好信息进行信息集结,进而得到最优的方案,最后,用算例进行了验证分析. 相似文献
18.
《统计与信息论坛》2019,(8):20-26
对由多个指标组成的多元数据进行聚类分析时,数据维度的增加、各指标与总体聚类的相关性程度不一致以及各指标服从的分布不同会增加聚类的复杂性,影响聚类结果的准确性,因此需要通过合适的方法来对多元数据进行聚类分析。针对这一问题,提出改进的带粘性的层次Dirichlet过程(sticky Hierarchical Dirichlet Process)方法来实现对多元数据的降维聚类,以解决各指标服从不同分布的问题,并用粘性参数反映各指标与总体聚类之间的相关性。用MCMC方法来估计模型参数。通过对仿真模拟数据和IRIS数据集的聚类分析,证实了该方法的有效性,同时发现单个指标与总体聚类的相关性越大,则相应的粘性参数越大,从而反映该指标在总体聚类中的重要性程度越高;并且当各指标数据中有粘性较大的指标时,带粘性的层次Dirichlet过程方法明显优于其他聚类方法,能够显著提高分类的准确性。 相似文献
19.
距离判别理论中,通常采用重心距离来定义类与类之间的距离对待判样品进行判别。对新样品实行判别,将其归入系统聚类形成的分类,如果仍采用重心距离判别法,会由于没有与原有聚类时所用的类与类之间的距离相一致而产生误判。提出对基于系统聚类分类结果的距离判别理论方法的补充,把系统聚类中的八种类与类之间距离的概念引入到距离判别方法中。从而使距离判别中类与类距离的定义与系统聚类中相一致,通过实例分析,证明增强了距离判别的可靠性。 相似文献
20.
本文引入了有序样本聚类的方法,对我国网民数量的增长率进行分析,从而给出了网民发展阶段划分的数据支持,进而对我国网民增速放缓的原因做出一些分析. 相似文献