首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 15 毫秒
1.
首先介绍了聚类的概念,然后提出了用模糊聚类算法对Web事务进行聚类。在聚类的相似性度量上,不再单纯地以访问次数或浏览时间来度量,而是采用用户浏览离散化时间为度量。该算法比传统算法准确性高,运行时间少,扩展性好。  相似文献   

2.
文章利用数据爬虫软件从淘宝网和卓创资讯网抓取上百万条数据,对数据进行清洗、选择和处理后,利用所得网络大数据,计算了PPI、CPI;运用K均值聚类、层次聚类对数据进行了分析;运用随机森林和深度学习算法对大数据价格指数进行数据挖掘,并将大数据计算的价格指数和数据挖掘价格指数结果与国家统计局公布数据进行比较分析.最后得出结论,基于大数据的PPI和CPI指数计算和数据挖掘模型的结果是有效的、切实可行的,并提出推动大数据应用于价格指数调查的相关政策建议.  相似文献   

3.
介绍了一种新的模糊聚类方法,定义了模糊熵,提出了基于最大模糊熵的模糊聚类的方法,得到了一种新的聚类算法——GCM算法。该算法的物理意义清晰,有明确的数学含义,相对于传统的FCM聚类算法,其聚类效果更好。  相似文献   

4.
针对模糊C均值算法(FCM算法)难以达到全局最优解的问题,引入了具有全局搜索能力的遗传算法以解决聚类问题,并在标准遗传算法基础上进行了改进。将该算法运用于IR IS数据的聚类,实现了较好的聚类,从而验证了算法的有效性。  相似文献   

5.
提出了一种新的层次聚类算法,先对数据集进行采样,以采样点为中心吸收邻域内的数据点形成子簇,再根据子簇是否相交实现层次聚类。在层次聚类过程中,重新定义了簇与簇之间的距离度量,并以此为基础建立堆结构。利用估计数据点总体分布的思想,证明该算法将逼近最优解。实验结果表明,算法的聚类效果大大优于现有的聚类算法。  相似文献   

6.
研究了一种基于向量空间模型的文档聚类方法.提出了一个新的聚类模型,即在传统聚类模型的基础上增加一个文档特征向量调整模块;给出了一个特征评价函数用以进行特征提取;对一种基于相似度的平面划分聚类算法做了一些改进.实验结果表明本文提出的聚类模型是可行的.  相似文献   

7.
文章针对单机聚类算法的可扩展性和效率低下的不足,提出一种并行聚类算法--K-mean并行聚类算法.在基于MPI的并行环境上,通过试验验证,该算法显示出较高的效率.  相似文献   

8.
辅修是本科教学中培养复合型人才的一项重要举措。通过对辅修教学管理的各个层面建立辅修教学调查指标体系,对采集到的数据进行预处理后利用数据挖掘技术如聚类算法中的k-中心点算法,关联规则中的Apriori算法等,挖掘出辅修教学各个层面之间的一些隐性规则,从而对辅修教学有一个全方位的了解和理性的分析,并能作出一些有意义的探索。  相似文献   

9.
隐节点中心的选取一直是各种RBF神经网络学习算法面临的主要问题之一,主要针对隐节点中心的选择问题,在研究减法聚类和模糊C-均值聚类算法优缺点的基础上,提出了改进的模糊聚类算法.仿真实验表明,改进的算法增强了网络对离群点的鲁棒性,同时缩短了网络的训练时间.  相似文献   

10.
人工免疫系统出现的时间并不长,但它具有的良好特性,如健壮性、自治与多层性、自我识别、分配性、增强的学习与记忆、捕获行为和噪音容忍等令人瞩目.语义Web的聚类是知识发现即数据挖掘的重要内容.本文引入了基于ontology的语义Web中人工免疫系统的免疫算法,尝试利用免疫系统的特性,借助aiNet进行分级概念聚类.  相似文献   

11.
针对层次聚类方法中的凝聚型层次聚类算法每次只合并两个类,迭代次数高、时间复杂度高的缺陷,提出了两种改进的算法:k近邻层次聚类和距离阈值层次聚类。然后对两种算法分别使用3组数据进行实验验证,结果表明两种算法均可以减少凝聚型层次聚类算法的迭代次数、降低时间复杂度;k近邻层次聚类需要输入的人为参数多,使得聚类结果的可靠性降低,距离阈值层次聚类的人为输入参数少,聚类结果的可靠性相对高,且聚类速度快。  相似文献   

12.
通过分析知经典的将图像分割成C类的常用的模糊C-均值聚类算法(FCMA)依赖于初始聚类中心的选择,通常得到的是局部最优解而并非全局最优解,又由于遗传算法能搜索到全局最优解,因此将遗传算法(GA)与FCMA相结合,对MRI直接进行聚类,利用遗传算法搜索全局最优解,从而有效地避免了模糊C-均值聚类算法收敛到局部最优的问题,并在此基础上实现了对MRI的分割,得到了比较满意的效果。  相似文献   

13.
一个文档往往包含多个主题的事件,把分散在多个文本中的同一主题事件组织起来依靠传统的文本聚类是无法实现的.本文通过对已有的CURE算法进行分析,根据事件的特征,对代表点的选取和小类合并机制进行改进,实现了一个改进的CURE算法.实验结果表明:改进后的方法在保证执行效率的情况下取得了更好的聚类效果.  相似文献   

14.
聚类算法在对图像进行分割的过程中要面对如何自动确定聚类类别数、如何克服图像特征点分布复杂的流形结构、如何减少算法的运行时间。针对这些问题,提出了流形距离的自动免疫克隆聚类图像分割算法。自动免疫克隆聚类算法可以自动确定聚类个数,不需要人为事先给定,并且确保全局收敛;使用流形距离可以反映空间分布复杂的流形数据;使用超像素而非像素来降低图像分割的时间等问题。通过对4组人工数据集和4幅自然图像进行实验,对比k-means算法、GCUK算法,结果表明该方法优势比较明显,具有一定的实用性和先进性。  相似文献   

15.
为实现复杂机械产品服务系统配置优化,首先应该对服务活动进行聚类。课题组提出把服务划分为复杂机械产品服务、服务功能集合、服务行为集合和服务活动4层层级结构。分析了服务活动的耦合关系,基于模糊聚类算法提出了复杂机械产品服务系统中服务活动聚类方法。以汽车产品服务为例,应用该方法获得汽车产品服务系统服务活动聚类方案,并采用逼近理想解法进行排序,选择出最优聚类方案。实际应用证明该方法为复杂机械产品服务系统服务活动聚类优化提供了合理的指导。  相似文献   

16.
将粒子群优化算法和K均值算法结合进行聚类分析,同时引入了免疫系统中的免疫接种和免疫选择机制来指导粒子的迭代过程,提出了一种基于免疫接种粒子群的聚类算法,在粒子群迭代的过程中加入免疫接种机制指导粒子的飞行方向,再通过免疫选择机制对接种的结果进行选择,确保粒子种群向更优的方向移动。实验结果证明,基于免疫接种粒子群的聚类算法基本克服了K均值算法容易受初始聚类中心影响的缺点,聚类结果稳定,而且比基于粒子群优化的聚类算法取得了更好的聚类效果。  相似文献   

17.
基于回归分析的思想,可以对现有的聚类算法进行改进,以在一定程度上解决我国中小企业信用评级时面临的违约率缺失与主观性较高的问题。首先对影响回归、聚类以及二者间一致性的因素进行了分析,选取了与之相关的描述变量;接着根据这些变量构造蒙特卡洛模拟,将获得的模拟数据用于回归分析,得到了关于聚类结果与被解释变量间一致性和聚类最优输入参数两个回归方程;最后将回归方程用于指导聚类算法,对我国中小企业的信用风险进行了评级。结果显示,改进后的聚类结果与代表中小企业信用风险大小的企业存续期之间有较好的一致程度,同时还发现,资产类指标对中小企业信用风险的影响较为明显。  相似文献   

18.
鉴于目前传统文本聚类方法中利用文档间的相似度进行聚类存在的问题,在传统的文本挖掘基础上提出了一种新的文本聚类算法——利用单词超团的二分图文本聚类算法。该算法用文档中单词的关联模式来评估文档间的相似度及主题类别预测,并利用图划分策略来大大降低文档相似度比较算法的复杂度,同时将超团作为特征结构的扩展,可以在一定范围内减少语言信息的丢失,提高聚类效果。经实验证明该算法具有较高的有效性。  相似文献   

19.
针对多数聚类集成方法忽视潜在信息或获取潜在信息方法复杂这一缺点,提出一种基于链接的模糊聚类集成方法。该算法首先利用模糊聚类算法建立集成信息矩阵,然后使用相应的链接方法将集成信息矩阵转化为反映数据相关性的权重图,最后运用图划分技术得到最终结果。实验结果表明,新提出的算法可以有效地获取潜在信息,同时提高聚类质量。  相似文献   

20.
该文针对模糊C-均值算法容易收敛于局部极小点的缺陷,将遗传算法应用于模糊C-均值算法(FCM)的优化计算中,其中对传统遗传算法的编码方案、遗传算子约束条件及适应值函数等方面进行改进,提出了一种基于改进遗传算法的模糊聚类方法。实验表明,将改进的遗传算法与FCM算法结合起来进行聚类分析,可以在一定程度上避免FCM算法对初始值敏感和容易陷入局部最优解的缺陷,使聚类更合理,比单一使用FCM算法进行聚类分析的效果要好。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号