首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 16 毫秒
1.
目前国内外各种聚类算法数以千百计,本文提出了一个基于聚类算法构成要素的分类框架,进行了文献综述,并指出了四个研究热点。  相似文献   

2.
对数据集进行聚类分析的过程中,由于数据属性包含的个性信息有差异,导致数据属性在聚类过程中的作用会有差异。因此需要对属性进行加权,以减少包含共性较多的属性对聚类结果的影响。目前粗糙集加权研究仅用于属性值为少数离散值的情况。提出了基于粗糙集指数加权算法,对原始数据集进行预处理,并设计实验,验证了该算法能够有效提高聚类算法的正确率。  相似文献   

3.
文章在信息技术迅速发展的背景下,研究针对海量数据计算机软硬件存储、分析的不足.通过研究海量数据下变量关联问题,构造了基于海量数据的学习算法.并通过数据模拟了该算法的应用原理.  相似文献   

4.
文章结合项目群管理思想,提出了基于模糊聚类分析的评价模型,运用模糊分析和模糊聚类进行多项目评价研究,并给出算例。结果表明,模糊聚类分析对企业项目群的分类是科学的、有效的。  相似文献   

5.
介绍了蚁群聚类算法的原理,建立了省域物流发展评价指标体系,同时结合黑龙江省的物流发展情况,应用蚁群算法进行实证研究,并对结果进行分析,从而为科学制定黑龙江省省域物流规划提供了依据。  相似文献   

6.
基于数据分布密度划分的聚类算法是数据挖掘聚类算法中的主要方法之一。针对传统密度划分聚类算法存在运算复杂、运行效率不高等缺陷,设计出高维分步投影的多重分区聚类算法;以高维分布投影密度为依据,对数据集进行多重分区产生数据集的子簇空间,并进行子簇合并形成了理想的聚类结果;依据算法进行实验,结果证明该算法具有运算简单和运行效率高等优良性。  相似文献   

7.
基于遗传算法的投影寻踪聚类   总被引:2,自引:0,他引:2  
传统的投影寻踪聚类算法PROCLUS是一种有效的处理高维数据聚类的算法,但此算法是利用爬山法(Hill climbing)对各类中心点进行循环迭代、选取最优的过程,由于爬山法是一种局部搜索(local search)方法,得到的最优解可能仅仅是局部最优。针对上述缺陷,提出一种改进的投影寻踪聚类算法,即利用遗传算法(Genetic Algorithm)对各类中心点进行循环迭代,寻找到全局最优解。仿真实验结果证明了新算法的可行性和有效性。  相似文献   

8.
数据分布密度划分的聚类算法是数据挖掘聚类算法的主要方法之一。针对传统密度划分聚类算法存在运算复杂、运行效率不高等缺陷,设计高维分步投影的多重分区聚类算法;以高维分布投影密度为依据,对数据集进行多重分区,产生数据集的子簇空间,并进行子簇合并,形成理想的聚类结果;依据该算法进行实验,结果证明该算法具有运算简单和运行效率高等优良性。  相似文献   

9.
研究了一种附有引力影响因子的半监督K-means核函数聚类算法,并将该方法应用于多因子选股模型中。研究表明,相比传统的聚类模型,改进的模型具有较强的泛化能力,模型在处理样本线性不可分、样本分布非球状簇等问题上具有明显的优势,能选出较优的股票组合。  相似文献   

10.
传统的K-Prototypes聚类算法是利用划分的思想来对混合数据进行聚类,但是当混合数据的维度增大时,对象之间的差异度几乎相等,使得此算法难以进行。针对上述缺陷,文章提出一种改进的K-Prototyes聚类算法,聚类前先剔除各类中不相关的维度,将高维混合数据投影降维后再进行聚类。文中给出了Heart Disease Databases的算例,验证了算法的有效性。  相似文献   

11.
文章介绍了基于高斯混合模型的期望最大化聚类算法,并对模型进行了简化,运用案例分析了该模型在经济管理领域中的应用,利用可视化的图形展示了研究样本的概率密度.  相似文献   

12.
该文建立了一种基于聚类分析与决策树分析相结合的服务订制预测模型,利用聚类提取训练集训练决策树,将生成模型应用于某地区用户对有线电视交互服务的订制意愿预测,最终确定高响应率客户群。实验证明,该模型相对于仅通过决策树进行预测能更大程度地提高分类精度,能更有效地识别出高响应率客户群。所提出的研究框架与方法,为企业在商业竞争中制定有效的营销决策提供了重要依据。  相似文献   

13.
目前研究的模糊C均值聚类算法(FCM)面临的最重要问题是初始值随机选取,导致其容易陷入局部最优,同时影响运算速度.而灰色预测GM(1,1)模型在形成预测公式时对初始值的选取也没有合理有效的方案.针对以上问题,文章提出坐标密度法,确定初始聚类中心,对FCM算法进行改进;接着提出运用改进的FCM求取GM(1,1)中数据的聚类中心,并把聚类中心作为初始值的方法;通过与已知算法进行比较验证了其可行性和有效性.  相似文献   

14.
对两阶聚类法自动确定聚类数规则的求证   总被引:1,自引:0,他引:1  
文章从两阶聚类法(TwoStep Cluster TSC)的原理出发,以联合对数极大似然估计值为基础,论证了BIC、BIC变化、BIC变化率、距离变化率等核心指标的计算公式,进而系统阐述了TSC分两步确定聚类数的规则,并通过实例对规则进行了演示.  相似文献   

15.
针对现有多属性灰色聚类评估方法不能准确地反映聚类对象的优势、劣势以及改进的方向的问题,文章提出了属性联合灰色聚类方法,并将该方法应用于评估我国区域高技术产业竞争力.结果表明:该方法能够综合评估多个属性对我国31个省、市、自治区高技术产业竞争力的影响,我国高技术产业竞争力有显著的区域性差异,且产业内、外部发展建设状况高度相关.  相似文献   

16.
传统的解决有序样本聚类的Fisher最优分割法对计算机存储能力要求较高,不适合由于样本长度较大时的情况.实践中常用的最优二分割法只能求得局部最优解.文章提出了一种基于遗传算法解决有序样拳聚类问题的新算法.该算法适用于多种聚类距离,适合于大样本,可以解决方向聚类问题.  相似文献   

17.
针对传统模糊C-均值聚类方法(fuzzy C-means,简称FCM)对初始值敏感导致的易陷入局部最优和噪声敏感问题,文章提出一种基于广度优先搜索的变异加权模糊C-均值聚类算法.该算法通过改进具有全局搜索能力的广度优先搜索算法(Breadth Fist Search,BFS)和有效聚类评价函数相结合,确定了接近真实的初始聚类中心,同时能够剔除噪声数据.在此基础上考虑属性噪声对聚类结果的影响问题,引入变异系数赋权法对FCM的目标函数进行改进,进一步提高了FCM算法的抗噪性.实验结果表明,该算法能够有效的克服传统FCM的不足,与其他聚类算法相比,具有较快的收敛速度、更好的聚类准确率及较高的抗噪性.  相似文献   

18.
针对传统的k-类支持向量机(SVM)算法对数据进行多分类时存在的特征变量间信息重叠、模型复杂法(度M高CC、)分对类同精类度别低中这的一特系征列变问量题进,文行章赋提权出,用使得用到灰的色综关合联变聚量类(建GR立C k)-对类特SV征M变模量型进,行给分出类了,一并种用改复进相的关k系-数类SVM多分类算法。实证分析表明,该算法的分类效果优于传统算法。  相似文献   

19.
基于改进的AdaBoost算法的信用评分模型   总被引:3,自引:0,他引:3  
将AdaBoost组合算法应用于信用评分模型中的分类问题,并针对该算法在解决不平衡分类问题上的一些不足,对算法进行了改进。应用此改进的AdaBoost算法,创建了新的信用评分模型,并进行了实证分析。实证结果表明,基于改进的AdaBoost算法的信用评分模型可以有效降低由于模型错判而导致的损失。  相似文献   

20.
时间序列曲线分类的目的是为了找到曲线之间相似波动结构、减少建模工作量和进行预测,所以分类的结果将直接影响模型的质量和预测的精度.为此,文章提出了一种新的时序曲线分类方法-分位点回归系数聚类法.它可以有效地避免一些分类方法带来的局限性,能够更为全面、详尽地考查待分类时序数据的运行方式,改善分类的效果并为预测提供强大的支持.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号