共查询到20条相似文献,搜索用时 15 毫秒
1.
随着数据挖掘技术的发展,作为数据挖掘中重要方法之一的聚类分析,先后出现了许多聚类算法。这些聚类算法均有其自身的优缺点。为了方便用户找到适合的聚类算法,本文根据不同的聚类原理对聚类算法进行分类,并概述了各类算法的发展情况。针对聚类的典型要求,归类出了一些有代表性的算法,同时对它们进行了分析和评价。文章最后给出了几种常用聚类算法的性能比较,并对聚类算法的发展进行了展望。 相似文献
2.
介绍了一种新的模糊聚类方法,定义了模糊熵,提出了基于最大模糊熵的模糊聚类的方法,得到了一种新的聚类算法——GCM算法。该算法的物理意义清晰,有明确的数学含义,相对于传统的FCM聚类算法,其聚类效果更好。 相似文献
3.
市场调查中的问卷设计由于沿袭传统调查冗长而复杂的方式,已成为当前互联网和移动互联网背景下市场调查的突出矛盾,造成受访者合作率下降、调查中断、数据异常等不良影响,从而导致调查质量下降,消费者洞察出现偏差.解决该问题的一个思路是使用问卷分割技术,而在进行具体的分割之前需要进行变量的分组.针对此类问题,本文提出了基于K-means聚类算法的问卷分割设计的变量分配方法,根据问卷问题之间的相关性,结合问卷调查目标,将一份较长的问卷分割成若干短问卷,并随机分配到不同的样本中去填答.本文结合实证详细阐述了问卷分割设计的具体过程,该设计可以作为市场调查设计和固定样本管理的一个新兴工具,在改善项目回答率和提高调查数据质量方面加以应用. 相似文献
4.
图像分割是指将一幅图像分解为若干互不交迭的区域的集合,是图像处理和计算机视觉的基本问题之一。为了提高图像分割的效率,提出了一种基于2维直方图加权的塔形模糊c均值(FCM)聚类图像快速分割算法。该方法先通过构造合理的2维直方图对噪声进行抑制;然后通过塔形分解来缩减聚类样本集;最后利用加权FCM聚类算法进行分类。仿真结果表明,该方法的效率明显优于标准的FCM算法。此外,为确定分割的最优类别数c,还引入了一种基于该快速算法的聚类有效性评价函数——修正划分模糊度,实现了最佳图像分割类别数c的自动确定。基于人造图像和实际图像的测试实验结果表明该方法是有效的。 相似文献
5.
袁银莉 《绍兴文理学院学报》2009,29(10)
隐节点中心的选取一直是各种RBF神经网络学习算法面临的主要问题之一,主要针对隐节点中心的选择问题,在研究减法聚类和模糊C-均值聚类算法优缺点的基础上,提出了改进的模糊聚类算法.仿真实验表明,改进的算法增强了网络对离群点的鲁棒性,同时缩短了网络的训练时间. 相似文献
6.
研究了一种基于向量空间模型的文档聚类方法.提出了一个新的聚类模型,即在传统聚类模型的基础上增加一个文档特征向量调整模块;给出了一个特征评价函数用以进行特征提取;对一种基于相似度的平面划分聚类算法做了一些改进.实验结果表明本文提出的聚类模型是可行的. 相似文献
7.
针对模糊C均值算法(FCM算法)难以达到全局最优解的问题,引入了具有全局搜索能力的遗传算法以解决聚类问题,并在标准遗传算法基础上进行了改进。将该算法运用于IR IS数据的聚类,实现了较好的聚类,从而验证了算法的有效性。 相似文献
8.
提出了一种新的层次聚类算法,先对数据集进行采样,以采样点为中心吸收邻域内的数据点形成子簇,再根据子簇是否相交实现层次聚类。在层次聚类过程中,重新定义了簇与簇之间的距离度量,并以此为基础建立堆结构。利用估计数据点总体分布的思想,证明该算法将逼近最优解。实验结果表明,算法的聚类效果大大优于现有的聚类算法。 相似文献
9.
博士学位论文是衡量博士研究生培养质量的重要指标。本文阐述了数据挖掘在教育领域的应用意义及聚类分析技术,通过对影响博士学位论文质量的相关属性进行分析处理,基于微软SSAS平台构建了博士学位论文质量聚类分析挖掘模型,以福州大学博士学位论文相关数据为实例进行聚类分析,找出影响博士学位论文质量的主要因素,从生源质量、科研条件、指导教师、在学期间发表论文、奖学金资助等方面为提高博士学位论文质量提供参考依据。 相似文献
10.
首先介绍了聚类的概念,然后提出了用模糊聚类算法对Web事务进行聚类。在聚类的相似性度量上,不再单纯地以访问次数或浏览时间来度量,而是采用用户浏览离散化时间为度量。该算法比传统算法准确性高,运行时间少,扩展性好。 相似文献
11.
邓志龙 《陕西青年管理干部学院学报》2010,(3):29-33
随着网络技术的发展,针对网络服务的攻击数量和严重程度显著提高,而这些报警数据大部分都是重复的、无效的。采用经典的面向属性的归纳(Attribute-Oriented Induction,AOI)算法进行概念聚类虽可以大幅度提高处理这些数据的工作量,然而在实际的工作中并不显得非常有效,本文就如何改进其算法作了说细的说明。 相似文献
12.
遗传聚类算法及其改进 总被引:1,自引:0,他引:1
本文给出了一种改进的基于遗传算法的聚类算法。传统的KMeans算法具有较强的局部搜索能力,但是对初始化聚类中心很敏感,容易陷入局部收敛性。基本遗传算法具有全局优化性,但局部搜索能力较差,收敛速度慢。针对二者算法的优缺点,利用了面向对象程序设计思想,结合二者的优点,提出了一种改进的遗传聚类算法。数据实验表明,该方法有效地提高了基于遗传算法的聚类算法的局部搜索能力和收敛速度。 相似文献
13.
教学评价在高职院校教学管理中起到一个非常重要的作用,如何将蚁群聚类算法应用其中,从大量数据中找到有用于教学的信息至关重要.本论文基于学生评价的蚁群聚类算法应用以及详细分析过程,最终得出的结果对高职院校教学管理具有一定的理论指导作用. 相似文献
14.
15.
该文针对模糊C-均值算法容易收敛于局部极小点的缺陷,将遗传算法应用于模糊C-均值算法(FCM)的优化计算中,其中对传统遗传算法的编码方案、遗传算子约束条件及适应值函数等方面进行改进,提出了一种基于改进遗传算法的模糊聚类方法。实验表明,将改进的遗传算法与FCM算法结合起来进行聚类分析,可以在一定程度上避免FCM算法对初始值敏感和容易陷入局部最优解的缺陷,使聚类更合理,比单一使用FCM算法进行聚类分析的效果要好。 相似文献
16.
针对多数聚类集成方法忽视潜在信息或获取潜在信息方法复杂这一缺点,提出一种基于链接的模糊聚类集成方法。该算法首先利用模糊聚类算法建立集成信息矩阵,然后使用相应的链接方法将集成信息矩阵转化为反映数据相关性的权重图,最后运用图划分技术得到最终结果。实验结果表明,新提出的算法可以有效地获取潜在信息,同时提高聚类质量。 相似文献
17.
将粒子群优化算法和K均值算法结合进行聚类分析,同时引入了免疫系统中的免疫接种和免疫选择机制来指导粒子的迭代过程,提出了一种基于免疫接种粒子群的聚类算法,在粒子群迭代的过程中加入免疫接种机制指导粒子的飞行方向,再通过免疫选择机制对接种的结果进行选择,确保粒子种群向更优的方向移动。实验结果证明,基于免疫接种粒子群的聚类算法基本克服了K均值算法容易受初始聚类中心影响的缺点,聚类结果稳定,而且比基于粒子群优化的聚类算法取得了更好的聚类效果。 相似文献
18.
19.
薛长峰 《盐城工学院学报(社会科学版)》1997,(1)
非对称广义特征值问题的并行处理是并行计算结构力学的重要部分,这方面的工作目前在国内外研究得还很少.将串行计算中求解非对称广义值问题AX=λBX(A、B为n阶实矩阵)行之有效的QZ算法作了并行化处理,并就得到的并行QZ算法在Challenge L并行机上进行了试算.数值结果表明:当处理机个数为2或4时并行效率良好,但当处理机个数为8时并行效率不高. 相似文献
20.
李金棉 《石家庄铁道学院学报(社会科学版)》2012,(2):18-20,26
以高速公路全寿命周期成本为基础,提出了应用模糊聚类估算模型计算高速公路运营成本的方法,并以大广高速深州至大名段为例,选取高速公路途经地区平均人均国内生产总值、总里程、路基宽度、桥涵设施数量、立交数量、收费站数量、服务区数量和平均日交通量等特征属性,依据12条高速公路的特征属性和运营成本,预测出大广高速的运营成本。 相似文献