首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 203 毫秒
1.
粒子群优化k均值的混合聚类算法研究   总被引:5,自引:0,他引:5  
k均值算法是聚类分析的一种传统算法,在数据挖掘中等领域得到了广泛的应用.本文在分析k均值聚类算法存在问题的基础上,用粒子群算法优化k均值聚类算法,提出了一种新的混合聚类算法.理论分析和实验结果证明,该算法有很好的全局收敛性,不仅有效地克服了传统的k均值算法易陷入局部极小值和对初始值敏感的问题,而且具有较快的收敛速度.  相似文献   

2.
基于空间聚类挖掘的城市应急救援机构选址研究   总被引:3,自引:0,他引:3  
以城市突发事件的应急管理为应用背景,研究使用空间聚类技术解决应急服务机构的选址问题.首先提出实施聚类分析的数据模型,然后改进既有空间聚类算法的基础上,提出了以.k-means聚类算法缩减解空间的搜索范围、以模拟退火算法为解搜索策略.基于GIS系统,充分考虑空间障碍物因素和空间环境因素等限制条件,提出(COD-MEANS-CLASA)的空间聚类算法以实现应急救援机构的科学选址.实验结果表明,提出的算法在执行效率和解质量两方面具有更好的表现.  相似文献   

3.
近年来,随着海量数据处理需求的增长,数据挖掘技术引起了研究者的广泛关注.本文针对在数据挖掘的首要问题数据聚类展开了研究.文章首先分析了聚类分析的基本定义,常用数据结构,相似性度量以及算法应具有的基本特征.然后分析了对应分析法和基于信息论的相关性度量法的基本理论,并介绍了常用的时间序列聚类算法.  相似文献   

4.
牛奔  郭晨  唐恒 《中国管理科学》2022,30(12):131-140
针对混合属性数据聚类问题,本文提出一种基于多目标多元学习细菌觅食优化算法。首先,基于改进的细菌觅食优化算法,提出多目标优化算法框架。然后,提出多元学习策略来提高算法性能。具体地,对于细菌个体,细菌之间采用环形拓扑学习策略,每个细菌只能向其邻域最优个体学习;细菌个体还可以向外部档案非支配个体学习。通过该学习策略,不仅可以保持种群的多样性,也可以加快算法收敛速度。对于外部档案非支配个体,记录其变化趋势,当非支配个体的变化处于停滞状态时,采用精英学习策略对非支配个体进行微扰动,提高非支配解的多样性。最后,为解决混合属性数据聚类问题,设计了一种具有属性权重的混合属性转换策略。为了验证所提算法的性能,将该算法与两个多目标进化算法和三个经典聚类算法在六个标准数据集上进行对比实验。实验结果表明,所提算法在解决数值、分类和混合属性数据聚类问题上具有显著优势。同时,以金融领域信用卡申请客户数据为例,进一步证实了所提算法的可行性,也表明了所提算法在涉及混合属性数据集的医疗、管理、工程等领域有一定的应用前景。  相似文献   

5.
数据挖掘技术中的聚类算法是解决客户细分问题的重要算法之一。为解决传统聚类算法在客户细分问题中分类精度较低、收敛速度较慢的问题,着重对比分析传统聚类算法中K-m eans、自组织映射网络和粒子群3种算法的不足,提出融合3种算法优点的混合型聚类算法,该算法利用K-m eans和自组织映射网络对初始聚类中心进行优化,结合粒子群优化和K-m eans优化聚类迭代过程,并在迭代优化过程中设计避免算法因早熟而停滞的机制。针对移动电子商务环境下的餐饮业客户细分问题,建立移动餐饮业客户细分模型,并利用混合型聚类算法、K-m eans、层级自组织映射网络和基于粒子群的K-m eans等4种算法对实际案例进行对比分析。研究结果表明,混合型聚类算法的聚类精度分别比其他3种算法高,同时还具有最快的收敛性能,更适用于客户细分问题。  相似文献   

6.
本文针对DBSCAN算法在计算速度方面的瓶颈,提出了一种新的基于内存的并行DBSCAN算法:合理划分数据库,各个处理器并行聚类,之后合并聚类结果,可以达到很好的聚类结果效果和计算效率。通过对一台双核计算机的实验,发现实验速度可以提高50%左右。  相似文献   

7.
该文提出了一种针对中文专利文本的聚类方法.使用自组织特征映射算法获得初始的聚类中心,并以此作为K-means算法的初始输入,从而得到最终的聚类结果.这样的组合可以在提高聚类准确率的同时,降低运行时间.在聚类之前还对文本进行LSI降维操作,降低了特征向量的维数,使得SOM和K-means两个对维数敏感的算法可以更加有效和快捷.  相似文献   

8.
虽然经典聚类算法能够有效地处理维度较低的数据对象,但随着维度的增加,算法的性能和效率就会明显下降.本文在对数据对象间的最大距离和平均距离随维数增加的变化趋势实验基础上,对聚类算法的聚类精度随数据对象维度增加的变化特征进行了实验研究.同时,利用复相关系数的倒数对属性进行加权,提出了利用复相关系数倒数阈值实现降维的方法,并取得了良好的实验结果.  相似文献   

9.
宋英 《科学咨询》2010,(15):69-70
近年来,随着海量数据处理需求的增长,数据挖掘技术引起了研究者的广泛关注。本文针对在数据挖掘的首要问题数据聚类展开了研究。文章首先分析了聚类分析的基本定义,常用数据结构,相似性度量以及算法应具有的基本特征。然后分析了对应分析法和基于信息论的相关性度量法的基本理论,并介绍了常用的时间序列聚类算法。  相似文献   

10.
针对基于在线客户评论数据进行客户细分分析的问题,设计了二阶段客户细分分析框架.在客户偏好建模阶段,设计了同义属性识别方法和属性偏好换算方法,基于产品属性树结构,构建粒度统一的客户偏好向量;在客户聚类阶段,设计了包含最优聚类数识别的聚类流程,基于模糊C均值聚类方法,对客户进行聚类.  相似文献   

11.
一种基于信息熵与K均值迭代模型的模糊聚类算法   总被引:1,自引:0,他引:1  
本文提出了基于信息熵和K均值算法混合迭代模糊聚类的细分模型,解决了模糊聚类的原型初始化参数问题。将信息熵和K均值算法引入模糊聚类中进行分析,并结合测试样本数据进行实际分析,与传统方法相比,取得了较好的效果。  相似文献   

12.
13.
云制造环境下的服务匹配具有资源数量大、语义信息不对称、QoS多样化和模糊化的特点,同时企业有自主选择匹配结果的需求。为此,提出基于本体和模糊QoS聚类的三阶段供应商匹配模型。首先构建本体模型和供应商服务描述模型,运用语义本体既消除了信息的不对称性,又增加了语义信息的完整性。此外,对QoS的多属性信息进行三角模糊化处理,结合模糊偏好和优化的模糊C均值聚类(FCM)算法按需聚类,提高了收敛速度和精度,得出基于匹配度排序的结果集合。实例验证结果表明:本文匹配方法较传统方法有更高的适应性和查准率。  相似文献   

14.
基于模糊聚类和模糊模式识别的企业财务预警   总被引:2,自引:0,他引:2  
郭德仁  王培辉 《管理学报》2009,6(9):1194-1197,1235
在回顾国内学者关于企业财务预警模型研究的基础上,提出了一种新的预警模型--基于模糊聚类和模糊模式识别模型.利用该模型对训练样本进行模糊聚类,计算最优聚类中心,对待估样本所属类别进行模糊模式识别.通过对40家沪市上市公司进行实证分析,取得了较好的预警效果.最后针对模型存在的问题提出进一步的研究方向.  相似文献   

15.
在软件项目开发过程中,准确估算出软件成本在提高软件质量和保障软件成功开发方面起到重要支撑作用。针对软件项目历史数据库中部分属性在项目开发初期难以给予精确数值(仅仅能给出模糊数),而已有软件成本估算模型不能很好地处理模糊信息的问题,本文在基于案例推理模型(CBR)基础上集成广义模糊数,提出了基于广义模糊数的CBR模型。使用基于广义模糊数的相似度度量方法代替传统CBR模型中采用的欧式距离等相似度度量方法,采用模糊C均值聚类(FCM)方法将已有软件项目历史数据库中的精确数值进行模糊化处理,以匹配新项目中的模糊数。进一步采用粒子群算法(PSO)来优化属性的权重,构建基于广义模糊数的加权CBR模型。最终在实验中采用Desharnais数据来检验构建模型的有效性。实证结果表明,在与常用的欧式距离CBR模型相比,构建的基于广义模糊数的加权CBR模型能有效提高估算精度,采用PSO优化属性权重能提高模型的估算精度。  相似文献   

16.
本文研究了粒子群优化的模糊聚类方法在车辆行驶工况中的应用。采用主成分分析方法将众多反映车辆行驶工况特征的运动学片段特征值进行压缩,用粒子群优化的模糊聚类方法对运动学片段的前三个主成分得分进行聚类,通过Matlab编程将上述理论用于合肥市典型道路行驶工况的构建和分析,按时间比例选取合适片段拟合代表性工况,并将代表性工况和采用K均值聚类法及模糊C均值聚类方法拟合的工况进行对比分析。研究结果表明,将粒子群优化的模糊聚类方法应用到工况的构建中可以有效地提高构建精度。  相似文献   

17.
This study addresses the part-machine grouping problem in group technology, and evaluates die performance of several cell formation methods for a wide range of data set sizes. Algorithms belonging to four classes are evaluated: (1) array-based methods: bond energy algorithm (BEA), direct clustering analysis (DCA) and improved rank order clustering algorithm (ROC2); (2) non-hierarchical clustering method: ZODIAC; (3) augmented machine matrix methods: augmented p-median method (APM) and augmented linear clustering algorithm (ALC); and (4) neural network algorithms: ART1 and variants: ART1/KS, ART1/KSC, and Fuzzy ART. The experimental design is based on a mixture-model approach, utilizing replicated clustering. The performance measures include Rand Index and bond energy recovery ratio, as well as computational requirements for various algorithms. Experimental factors include problem size, degree of data imperfection, and algorithm tested. The results show that, among the algorithms applicable for large, industry-size data sets, ALC and neural networks are superior to ZODIAC, which in turn is generally superior to array-based methods of ROC2 and DCA.  相似文献   

18.
Concerning the essence of risk, we suggest a new definition of risk: a scene in the future associated with some adverse incident. In many cases, risks are rather fuzzy for our perception because of the shortage of knowledge or information about the systems that determine the adverse incidents. We introduce a concept of fuzzy risk based on the new risk definition and fuzzy sets. And, in this article, we suggest a fuzzy average algorithm to update a fuzzy risk that stores all information from the original data. To illustrate the algorithm, we update a soft risk map of flood where the fuzzy risks are calculated using the interior-outer-set model.  相似文献   

19.
从系统集成优化的角度研究震后应急物资配送的一种新模糊定位-路径问题(LRP),综合考虑救灾点所在地理位置和地形导致的应急车辆行驶时间的随机性、救灾点应急物资需求量的不确定性与应急物资配送的时间紧迫性,以应急物资总运达时间最短与总配送成本最小为目标,构建一个基于机会约束规划的多目标模糊LRP优化模型,并根据模型的特点设计了一种混合免疫遗传算法予以求解。最后,通过算例验证了本文方法能有效解决震后应急物资配送的模糊多目标LRP,实现了震后应急物流中心定位和应急车辆路径规划的联合决策。  相似文献   

20.
We study algorithms for clustering data that were recently proposed by Balcan et al. (SODA’09: 19th Annual ACM-SIAM Symposium on Discrete Algorithms, pp. 1068–1077, 2009a) and that have already given rise to several follow-up papers. The input for the clustering problem consists of points in a metric space and a number k, specifying the desired number of clusters. The algorithms find a clustering that is provably close to a target clustering, provided that the instance has the “(1+α,ε)-property”, which means that the instance is such that all solutions to the k-median problem for which the objective value is at most (1+α) times the optimal objective value correspond to clusterings that misclassify at most an ε fraction of the points with respect to the target clustering. We investigate the theoretical and practical implications of their results. Our main contributions are as follows. First, we show that instances that have the (1+α,ε)-property and for which, additionally, the clusters in the target clustering are large, are easier than general instances: the algorithm proposed in Balcan et al. (SODA’09: 19th Annual ACM-SIAM Symposium on Discrete Algorithms, pp. 1068–1077, 2009a) is a constant factor approximation algorithm with an approximation guarantee that is better than the known hardness of approximation for general instances. Further, we show that it is NP-hard to check if an instance satisfies the (1+α,ε)-property for a given (α,ε); the algorithms in Balcan et al. (SODA’09: 19th Annual ACM-SIAM Symposium on Discrete Algorithms, pp. 1068–1077, 2009a) need such α and ε as input parameters, however. We propose ways to use their algorithms even if we do not know values of α and ε for which the assumption holds. Finally, we implement these methods and other popular methods, and test them on real world data sets. We find that on these data sets there are no α and ε so that the dataset has both (1+α,ε)-property and sufficiently large clusters in the target solution. For the general case where there are no assumptions about the cluster sizes, we show that on our data sets the performance guarantee proved by Balcan et a. (SODA’09: 19th Annual ACM-SIAM Symposium on Discrete Algorithms, pp. 1068–1077, 2009a) is meaningless for the values of α,ε for which the data set has the (1+α,ε)-property. The algorithm nonetheless gives reasonable results, although it is outperformed by other methods.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号